arXiv reaDer
深い半教師あり学習のためのプログレッシブ代表ラベリング
Progressive Representative Labeling for Deep Semi-Supervised Learning
ディープ半教師あり学習(SSL)は、ラベル付けされていない大量のデータを活用して、ラベル付けされたデータが限られているディープラーニングのパフォーマンスを向上させるために、近年大きな注目を集めています。疑似ラベル付けは、ラベル付けされたデータセットを拡張するための一般的なアプローチです。ただし、より効果的なラベル付けの方法があるかどうかは、未解決の問題のままです。この論文では、ラベル付けされたセットを拡張するために、最も代表的なサンプルのみにラベルを付けることを提案します。有向k最近傍(kNN)グラフ上の対応するノードの程度によって選択された代表的なサンプルは、他の多くのサンプルのk最近傍にあります。グラフニューラルネットワーク(GNN)ラベラーを設計して、漸進的な学習方法でそれらにラベルを付けます。プログレッシブGNNラベラーの支援を受けて、当社のディープSSLアプローチは、CIFAR-10、SVHN、ILSVRC-2012などのいくつかの一般的なSSLベンチマークで最先端の方法よりも優れています。特に、ラベル付けされたデータが10%しかない、やりがいのあるImageNetベンチマークで、72.1%のトップ1精度を達成し、以前の最高の結果を3.3%上回っています。
Deep semi-supervised learning (SSL) has experienced significant attention in recent years, to leverage a huge amount of unlabeled data to improve the performance of deep learning with limited labeled data. Pseudo-labeling is a popular approach to expand the labeled dataset. However, whether there is a more effective way of labeling remains an open problem. In this paper, we propose to label only the most representative samples to expand the labeled set. Representative samples, selected by indegree of corresponding nodes on a directed k-nearest neighbor (kNN) graph, lie in the k-nearest neighborhood of many other samples. We design a graph neural network (GNN) labeler to label them in a progressive learning manner. Aided by the progressive GNN labeler, our deep SSL approach outperforms state-of-the-art methods on several popular SSL benchmarks including CIFAR-10, SVHN, and ILSVRC-2012. Notably, we achieve 72.1% top-1 accuracy, surpassing the previous best result by 3.3%, on the challenging ImageNet benchmark with only 10% labeled data.
updated: Fri Aug 13 2021 05:39:50 GMT+0000 (UTC)
published: Fri Aug 13 2021 05:39:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト