arXiv reaDer
二重確率部分空間クラスタリング
Doubly Stochastic Subspace Clustering
多くの最先端の部分空間クラスタリング手法は、最初にデータポイント間の親和性マトリックスを構築し、次にこの親和性にスペクトルクラスタリングを適用することにより、2段階のプロセスに従います。これらの方法に関する研究のほとんどは、親和性を生成する最初のステップに焦点を当てています。これは、線形部分空間の自己表現特性を利用することが多く、最終的なクラスタリングを生成するスペクトルクラスタリングステップは通常ほとんど考慮されていません。さらに、既存の方法では、自己表現型クラスタリングの定式化によって生成された親和性にアドホックまたは任意に選択した後処理ステップを適用することにより、スペクトルクラスタリングステップで使用される最終的な親和性を取得することがよくあります。これは、全体的なクラスタリングパフォーマンスに大きな影響を与える可能性があります。 。この作業では、データの自己表現表現と、スペクトルクラスタリング用に十分に正規化された親和性行列の両方を学習することにより、これら2つのステップを統合します。提案されたモデルでは、親和性行列を二重確率行列に制約します。これにより、スペクトルクラスタリングで二重確率正規化の既知の利点を活用しながら、親和性行列の正規化の原理的な方法が得られます。一般的なフレームワークを開発し、2つのモデルを導き出します。1つは二重確率親和性とともに自己表現表現を共同で学習し、もう1つは順番に解決します。さらに、問題のスパース性を活用して、大規模なデータセットでの効率的な計算を可能にするシーケンシャルソルバーの高速有効制約法を開発します。実験は、私たちの方法がコンピュータビジョンの多くの一般的なデータセットで最先端の部分空間クラスタリングパフォーマンスを達成することを示しています。
Many state-of-the-art subspace clustering methods follow a two-step process by first constructing an affinity matrix between data points and then applying spectral clustering to this affinity. Most of the research into these methods focuses on the first step of generating the affinity, which often exploits the self-expressive property of linear subspaces, with little consideration typically given to the spectral clustering step that produces the final clustering. Moreover, existing methods often obtain the final affinity that is used in the spectral clustering step by applying ad-hoc or arbitrarily chosen postprocessing steps to the affinity generated by a self-expressive clustering formulation, which can have a significant impact on the overall clustering performance. In this work, we unify these two steps by learning both a self-expressive representation of the data and an affinity matrix that is well-normalized for spectral clustering. In our proposed models, we constrain the affinity matrix to be doubly stochastic, which results in a principled method for affinity matrix normalization while also exploiting known benefits of doubly stochastic normalization in spectral clustering. We develop a general framework and derive two models: one that jointly learns the self-expressive representation along with the doubly stochastic affinity, and one that sequentially solves for one then the other. Furthermore, we leverage sparsity in the problem to develop a fast active-set method for the sequential solver that enables efficient computation on large datasets. Experiments show that our method achieves state-of-the-art subspace clustering performance on many common datasets in computer vision.
updated: Mon Apr 19 2021 23:50:41 GMT+0000 (UTC)
published: Mon Nov 30 2020 14:56:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト