arXiv reaDer
自己ペースの主成分分析
Self-paced Principal Component Analysis
主成分分析(PCA)は、次元削減と特徴抽出に広く使用されています。ロバストPCA(RPCA)は、l1-normやl2、p-normなどのさまざまなロバスト距離メトリックの下で、ノイズや外れ値をある程度処理できます。ただし、実際のデータには、これらの単純な関数では完全にキャプチャできない構造が表示される場合があります。さらに、既存の方法では、複雑なサンプルと単純なサンプルを同等に扱います。対照的に、人間が通常採用する学習パターンは、単純なものから複雑なものへ、そして少ないものから多いものへと学習することです。この原理に基づいて、ノイズと外れ値の影響をさらに低減するために、セルフペースPCA(SPCA)と呼ばれる新しい方法を提案します。特に、各サンプルの複雑さは、単純なものからより複雑なものまでのサンプルをトレーニングに統合するために、各反復の開始時に計算されます。交互の最適化に基づいて、SPCAは最適な射影行列を見つけ、外れ値を繰り返しフィルターで除去します。 SPCAの合理性を示すために理論的分析が提示されます。人気のあるデータセットでの広範な実験は、提案された方法が最先端の結果を大幅に改善できることを示しています。
Principal Component Analysis (PCA) has been widely used for dimensionality reduction and feature extraction. Robust PCA (RPCA), under different robust distance metrics, such as l1-norm and l2, p-norm, can deal with noise or outliers to some extent. However, real-world data may display structures that can not be fully captured by these simple functions. In addition, existing methods treat complex and simple samples equally. By contrast, a learning pattern typically adopted by human beings is to learn from simple to complex and less to more. Based on this principle, we propose a novel method called Self-paced PCA (SPCA) to further reduce the effect of noise and outliers. Notably, the complexity of each sample is calculated at the beginning of each iteration in order to integrate samples from simple to more complex into training. Based on an alternating optimization, SPCA finds an optimal projection matrix and filters out outliers iteratively. Theoretical analysis is presented to show the rationality of SPCA. Extensive experiments on popular data sets demonstrate that the proposed method can improve the state of-the-art results considerably.
updated: Fri Jun 25 2021 20:50:45 GMT+0000 (UTC)
published: Fri Jun 25 2021 20:50:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト