arXiv reaDer
コンセンサスの構築によるクラスタリングの表現学習
Representation Learning for Clustering via Building Consensus
この論文では、画像のクラスタリングのための教師なし表現学習に焦点を当てます。ディープクラスタリングと教師なし表現学習の最近の進歩は、入力画像のさまざまなビュー(データ拡張技術によって生成された)が表現空間に近接している必要がある(例の一貫性)、および/または同様の画像が同様のクラスター割り当てを持っている必要があるという考えに基づいています(人口の一貫性)。一貫性、コンセンサス一貫性の追加の概念を定義します。これにより、表現が学習され、表現空間のバリエーション、異なるクラスタリングアルゴリズム、または単一のクラスタリングアルゴリズムの異なる初期化に対して同様のパーティションが誘導されます。表現空間でバリエーションを実行することによってクラスタリング損失を定義し、3つの一貫性(コンセンサス、エグザンプラ、および母集団)すべてをエンドツーエンドの学習フレームワークにシームレスに統合します。提案されたアルゴリズムである教師なし表現学習(ConCURL)を使用したコンセンサスクラスタリングは、5つの画像データセットのうち4つで最先端の方法のクラスタリングパフォーマンスを向上させます。さらに、クラスタリングの評価手順を拡張して、分散シフトが発生した場合のクラスタリングパフォーマンスの維持など、実際のクラスタリングタスクで発生する課題を反映します。また、提案されたアルゴリズムをより深く理解するために、詳細なアブレーション研究を実行します。コードとトレーニング済みモデルは、https://github.com/JayanthRR/ConCURL_NCEで入手できます。
In this paper, we focus on unsupervised representation learning for clustering of images. Recent advances in deep clustering and unsupervised representation learning are based on the idea that different views of an input image (generated through data augmentation techniques) must be close in the representation space (exemplar consistency), and/or similar images must have similar cluster assignments (population consistency). We define an additional notion of consistency, consensus consistency, which ensures that representations are learned to induce similar partitions for variations in the representation space, different clustering algorithms or different initializations of a single clustering algorithm. We define a clustering loss by executing variations in the representation space and seamlessly integrate all three consistencies (consensus, exemplar and population) into an end-to-end learning framework. The proposed algorithm, consensus clustering using unsupervised representation learning (ConCURL), improves upon the clustering performance of state-of-the-art methods on four out of five image datasets. Furthermore, we extend the evaluation procedure for clustering to reflect the challenges encountered in real-world clustering tasks, such as maintaining clustering performance in cases with distribution shifts. We also perform a detailed ablation study for a deeper understanding of the proposed algorithm. The code and the trained models are available at https://github.com/JayanthRR/ConCURL_NCE.
updated: Mon Apr 25 2022 05:04:50 GMT+0000 (UTC)
published: Tue May 04 2021 05:04:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト