arXiv reaDer
教師なし画像分類・セグメンテーションのための不変情報クラスタリング
Invariant Information Clustering for Unsupervised Image Classification and Segmentation
ラベル付けされていないデータサンプルのみを与えて、ニューラルネットワーク分類器をゼロから学習する新しいクラスタリング目的を提示する。このモデルは、意味クラスと正確に一致するクラスタを発見し、画像の分類とセグメンテーションを含む8つの教師なしクラスタリングベンチマークにおいて、最先端の結果を達成した。これらには、ImageNetの教師なし変形版であるSTL10とCIFAR10が含まれており、最も近い競合の精度をそれぞれ6.6%、9.5%の絶対的なパーセンテージポイントで大幅に上回った。この手法はコンピュータビジョンに特化したものではなく、任意のペアのデータセットサンプルで動作する。訓練されたネットワークは、意味的クラスタリングに使用するために外部処理を必要とする高次元表現ではなく、意味的ラベルを直接出力する。目的は単純に各ペアのクラス割り当ての間の相互情報を最大化することである。これは実装が容易であり、情報理論に厳密に基づいているため、他のクラスタリング手法にありがちな退化した解を簡単に避けることができることを意味する。完全教師なしモードに加えて、2つの半教師ありモードもテストした。1つ目はSTL10の分類において88.8%の精度を達成し、既存のすべての手法(教師あり、半教師あり、教師なしのいずれであっても)に対して新たな世界的な最先端の手法を設定した。2つ目は、ラベルカバレッジの90%削減に対してロバスト性を示し、少量のラベルを利用したいアプリケーションに関連している。github.com/xu-ji/IIC
We present a novel clustering objective that learns a neural network classifier from scratch, given only unlabelled data samples. The model discovers clusters that accurately match semantic classes, achieving state-of-the-art results in eight unsupervised clustering benchmarks spanning image classification and segmentation. These include STL10, an unsupervised variant of ImageNet, and CIFAR10, where we significantly beat the accuracy of our closest competitors by 6.6 and 9.5 absolute percentage points respectively. The method is not specialised to computer vision and operates on any paired dataset samples; in our experiments we use random transforms to obtain a pair from each image. The trained network directly outputs semantic labels, rather than high dimensional representations that need external processing to be usable for semantic clustering. The objective is simply to maximise mutual information between the class assignments of each pair. It is easy to implement and rigorously grounded in information theory, meaning we effortlessly avoid degenerate solutions that other clustering methods are susceptible to. In addition to the fully unsupervised mode, we also test two semi-supervised settings. The first achieves 88.8% accuracy on STL10 classification, setting a new global state-of-the-art over all existing methods (whether supervised, semi-supervised or unsupervised). The second shows robustness to 90% reductions in label coverage, of relevance to applications that wish to make use of small amounts of labels. github.com/xu-ji/IIC
updated: Thu Aug 22 2019 14:32:16 GMT+0000 (UTC)
published: Tue Jul 17 2018 20:17:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト