arXiv reaDer
スパース主成分分析の新しい基礎
A New Basis for Sparse Principal Component Analysis
スパース主成分分析(PCA)の以前のバージョンでは、固有基底(ap×k行列)はほぼスパースであると想定されていました。 ak×k回転後にp×k行列がほぼスパースになると仮定する方法を提案します。アルゴリズムの最も単純なバージョンは、先頭のk主成分で初期化されます。次に、主成分をk×kの直交回転で回転させて、主成分をほぼスパースにします。最後に、ソフトしきい値が回転した主成分に適用されます。このアプローチは、直交回転を使用してスパース基底を近似するため、以前のアプローチとは異なります。結果の1つは、スパースコンポーネントが主要な固有ベクトルである必要はなく、それらの混合である必要があるということです。このようにして、スパースPCAの新しい(回転)基底を提案します。さらに、私たちのアプローチは、「デフレ」とそれに必要な複数のチューニングパラメータを回避します。私たちのスパースPCAフレームワークは用途が広いです。たとえば、行と列の次元削減を同時に行うためのデータマトリックスの双方向分析に自然に拡張されます。同じレベルのスパース性に対して、提案されたスパースPCA法はより安定しており、代替方法と比較してより多くの分散を説明できることを示す証拠を提供します。画像のスパースコーディング、トランスクリプトームシーケンスデータの分析、ソーシャルネットワークの大規模クラスタリングの3つのアプリケーションを通じて、多変量データの探索におけるスパースPCAの最新の有用性を示します。
Previous versions of sparse principal component analysis (PCA) have presumed that the eigen-basis (a p ×k matrix) is approximately sparse. We propose a method that presumes the p ×k matrix becomes approximately sparse after a k ×k rotation. The simplest version of the algorithm initializes with the leading k principal components. Then, the principal components are rotated with an k ×k orthogonal rotation to make them approximately sparse. Finally, soft-thresholding is applied to the rotated principal components. This approach differs from prior approaches because it uses an orthogonal rotation to approximate a sparse basis. One consequence is that a sparse component need not to be a leading eigenvector, but rather a mixture of them. In this way, we propose a new (rotated) basis for sparse PCA. In addition, our approach avoids "deflation" and multiple tuning parameters required for that. Our sparse PCA framework is versatile; for example, it extends naturally to a two-way analysis of a data matrix for simultaneous dimensionality reduction of rows and columns. We provide evidence showing that for the same level of sparsity, the proposed sparse PCA method is more stable and can explain more variance compared to alternative methods. Through three applications -- sparse coding of images, analysis of transcriptome sequencing data, and large-scale clustering of social networks, we demonstrate the modern usefulness of sparse PCA in exploring multivariate data.
updated: Tue Sep 07 2021 06:17:49 GMT+0000 (UTC)
published: Wed Jul 01 2020 16:32:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト