arXiv reaDer
教師なし画像分類のための疑似ラベル付けオートエンコーダー
A Pseudo-labelling Auto-Encoder for unsupervised image classification
この論文では、ノイズ除去オートエンコーダーのユニークなバリエーションを紹介し、それを知覚損失と組み合わせて、教師なしの方法で画像を分類します。疑似ラベリングと呼ばれる提案された方法は、最初にランダムにサンプリングされたデータ拡張変換のセットを各トレーニング画像に適用することから成ります。その結果、各初期イメージは、対応する拡張イメージに対する疑似ラベルと見なすことができます。次に、オートエンコーダーを使用して、拡張画像の各セットとそれに対応する疑似ラベル間のマッピングを学習します。さらに、画像の同じ近傍にあるピクセル間の既存の依存関係を考慮に入れるために、知覚的損失が使用されます。この組み合わせにより、エンコーダーは、入力のクラスについて非常に有益な、よりリッチなエンコーディングを出力するようになります。その結果、教師なし画像分類でのオートエンコーダーのパフォーマンスは、テストされたすべてのデータセット全体の安定性、精度、および一貫性の点で改善されます。 MNIST、CIFAR-10、SVHN データセットの以前の最先端の精度は、それぞれ 0.3%、3.11%、9.21% 向上しています。
In this paper, we introduce a unique variant of the denoising Auto-Encoder and combine it with the perceptual loss to classify images in an unsupervised manner. The proposed method, called Pseudo Labelling, consists of first applying a randomly sampled set of data augmentation transformations to each training image. As a result, each initial image can be considered as a pseudo-label to its corresponding augmented ones. Then, an Auto-Encoder is used to learn the mapping between each set of the augmented images and its corresponding pseudo-label. Furthermore, the perceptual loss is employed to take into consideration the existing dependencies between the pixels in the same neighbourhood of an image. This combination encourages the encoder to output richer encodings that are highly informative of the input's class. Consequently, the Auto-Encoder's performance on unsupervised image classification is improved in terms of stability, accuracy and consistency across all tested datasets. Previous state-of-the-art accuracy on the MNIST, CIFAR-10 and SVHN datasets is improved by 0.3%, 3.11% and 9.21% respectively.
updated: Mon May 31 2021 17:16:14 GMT+0000 (UTC)
published: Sun Dec 06 2020 17:03:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト