ActiveMatch: End-to-end Semi-supervised Active Representation Learning
半教師あり学習(SSL)は、ラベル付きデータとラベルなしデータの両方を使用してモデルをトレーニングできる効率的なフレームワークです。ただし、ラベルの数が限られているため、SSLの学習された表現はあいまいであり、クラス間サンプルでは区別できません。さらに、SSLのパフォーマンスもモデルの初期化に大きく依存します。 SSLの欠点に対処するために、この論文では、SSLと対照学習およびアクティブラーニングを組み合わせて限られたラベルを完全に活用する、新しいエンドツーエンドの表現学習方法、つまりActiveMatchを提案します。 ActiveMatchは、ウォームアップとして教師なし対照学習を使用した少量のラベル付きデータから開始し、SSLと教師あり対照学習を組み合わせて、トレーニング中にラベル付けする最も代表的なサンプルを積極的に選択し、分類に対する表現を改善します。 MixMatchおよびFixMatchと比較して、ActiveMatchが最先端のパフォーマンスを達成していることを示します。100個のラベルが収集されたCIFAR-10で89.24の精度、200個のラベルが収集された92.20の精度です。
Semi-supervised learning (SSL) is an efficient framework that can train models with both labeled and unlabeled data. However, constrained by the limited number of labels, the learned representations of SSL are ambiguous and not distinguishable for inter-class samples. Moreover, the performance of SSL is also largely dependent on the model initialization. To deal with the drawbacks of SSL, in this paper, we propose a novel end-to-end representation learning method, namely ActiveMatch, which combines SSL with contrastive learning and active learning to fully leverage the limited labels. Starting from a small amount of labeled data with unsupervised contrastive learning as a warm-up, ActiveMatch then combines SSL and supervised contrastive learning, and actively selects the most representative samples for labeling during the training, resulting in better representations towards the classification. Compared with MixMatch and FixMatch, we show that ActiveMatch achieves the state-of-the-art performance, with 89.24 accuracy on CIFAR-10 with 100 collected labels, and 92.20 accuracy with 200 collected labels.
updated: Wed Oct 06 2021 06:07:40 GMT+0000 (UTC)
published: Wed Oct 06 2021 06:07:40 GMT+0000 (UTC)
