arXiv reaDer
自己表現型深部部分空間クラスタリングの批評
A Critique of Self-Expressive Deep Subspace Clustering
部分空間クラスタリングは、線形部分空間の和集合でサポートされるデータをクラスター化するように設計された教師なしクラスタリング手法であり、各部分空間は周囲空間よりも小さい次元のクラスターを定義します。この問題の既存の定式化の多くは、線形部分空間の自己表現特性を利用することに基づいています。この場合、部分空間内の任意の点は、部分空間内の他の点の線形結合として表すことができます。このアプローチを非線形多様体の結合でサポートされるデータに拡張するために、多くの研究が、埋め込み空間のデータの自己表現損失関数によって正規化されたニューラルネットワークを使用して元のデータの埋め込みを学習することを提案しています。埋め込み空間のデータに先行する線形部分空間の和集合。ここでは、このアプローチには、以前の作業では適切に対処されていない潜在的な欠陥がいくつかあることを示します。特に、モデルの定式化は、データの縮退した埋め込みにつながる可能性があるという点で不適切であることがよくあります。これは、部分空間の結合にまったく対応する必要がなく、クラスタリングにはあまり適していません。理論結果を実験的に検証し、文献で報告されている以前の実験を繰り返します。ここでは、以前に主張されたパフォーマンス上の利点のかなりの部分が、深部部分空間クラスタリングモデルではなくアドホック後処理ステップに起因すると結論付けています。
Subspace clustering is an unsupervised clustering technique designed to cluster data that is supported on a union of linear subspaces, with each subspace defining a cluster with dimension lower than the ambient space. Many existing formulations for this problem are based on exploiting the self-expressive property of linear subspaces, where any point within a subspace can be represented as linear combination of other points within the subspace. To extend this approach to data supported on a union of non-linear manifolds, numerous studies have proposed learning an embedding of the original data using a neural network which is regularized by a self-expressive loss function on the data in the embedded space to encourage a union of linear subspaces prior on the data in the embedded space. Here we show that there are a number of potential flaws with this approach which have not been adequately addressed in prior work. In particular, we show the model formulation is often ill-posed in that it can lead to a degenerate embedding of the data, which need not correspond to a union of subspaces at all and is poorly suited for clustering. We validate our theoretical results experimentally and also repeat prior experiments reported in the literature, where we conclude that a significant portion of the previously claimed performance benefits can be attributed to an ad-hoc post processing step rather than the deep subspace clustering model.
updated: Fri Mar 19 2021 20:33:37 GMT+0000 (UTC)
published: Thu Oct 08 2020 00:14:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト