arXiv reaDer
PMSSC:部分空間クラスタリングのための並列化可能なマルチサブセットベースの自己表現モデル
PMSSC: Parallelizable Multi-Subset based Self-Expressive Model for Subspace Clustering
部分空間クラスタリング手法は、データセット内の他のデータポイントの線形結合が強力な教師なし学習手法であるため、各データポイントを表す自己表現モデルを採用しています。ただし、大規模なデータセットを扱う場合、すべてのデータポイントを辞書として参照することによる各データポイントの表現は、計算が非常に複雑になるという問題があります。この問題を軽減するために、並列化可能なマルチサブセットベースの自己表現モデル(PMS)を導入します。これは、複数のサブセットを組み合わせて各データポイントを表し、それぞれがサンプルのごく一部で構成されています。部分空間クラスタリング(PMSSC)でのPMSの採用は、各サブセットに分解される各最適化問題が小さく、並行して効率的に解決できるため、計算上の利点につながります。また、PMSSCはサブセットから得られた複数の自己表現係数ベクトルを組み合わせることができ、自己表現力の向上に貢献します。合成データと実際のデータセットに関する広範な実験は、競合する方法に対する私たちのアプローチの効率と有効性を示しています。
Subspace clustering methods embrace a self-expressive model that represents each data point as a linear combination of other data points in the dataset are powerful unsupervised learning techniques. However, when dealing with large-scale datasets, the representation of each data point by referring to all data points as a dictionary suffers from high computational complexity. To alleviate this issue, we introduce a parallelizable multi-subset based self-expressive model (PMS) which represents each data point by combing multiple subsets, with each consisting of only a small percentage of samples. The adoption of PMS in subspace clustering (PMSSC) leads to computational advantages because each optimization problem decomposed into each subset is small, and can be solved efficiently in parallel. Besides, PMSSC is able to combine multiple self-expressive coefficient vectors obtained from subsets, which contributes to the improvement of self-expressiveness. Extensive experiments on synthetic data and real-world datasets show the efficiency and effectiveness of our approach against competitive methods.
updated: Wed Nov 24 2021 02:22:43 GMT+0000 (UTC)
published: Wed Nov 24 2021 02:22:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト