Pseudo-Labeling and Confirmation Bias in Deep Semi-Supervised Learning
 半教師付き学習、つまりラベル付きサンプルとラベルなしサンプルからの共同学習は、人間の監督を緩和する上で重要な役割があるため、活発な研究トピックです。画像分類のコンテキストでは、ラベルなしサンプルから学習する最近の進歩は、ラベルなしサンプルのさまざまな摂動に対する不変予測を促進する一貫性正則化方法に主に焦点を当てています。逆に、ネットワーク予測を使用してソフト擬似ラベルを生成することにより、ラベルなしデータから学習することを提案します。いわゆる確認バイアスにより、ナイーブな擬似ラベルが誤った擬似ラベルにオーバーフィットすることを示し、混同の増大とミニバッチあたりのラベル付きサンプルの最小数の設定が、それを減らすための効果的な正則化手法であることを示します。提案されたアプローチは、他の方法よりもはるかに単純であるにもかかわらず、CIFAR-10 / 100、SVHN、およびMini-ImageNetで最先端の結果を達成します。これらの結果は、以前の研究では逆のことが想定されていたが、疑似ラベル付けだけで一貫性のある正則化手法よりも優れていることを示しています。ソースコードはで入手できます。
Semi-supervised learning, i.e. jointly learning from labeled and unlabeled samples, is an active research topic due to its key role on relaxing human supervision. In the context of image classification, recent advances to learn from unlabeled samples are mainly focused on consistency regularization methods that encourage invariant predictions for different perturbations of unlabeled samples. We, conversely, propose to learn from unlabeled data by generating soft pseudo-labels using the network predictions. We show that a naive pseudo-labeling overfits to incorrect pseudo-labels due to the so-called confirmation bias and demonstrate that mixup augmentation and setting a minimum number of labeled samples per mini-batch are effective regularization techniques for reducing it. The proposed approach achieves state-of-the-art results in CIFAR-10/100, SVHN, and Mini-ImageNet despite being much simpler than other methods. These results demonstrate that pseudo-labeling alone can outperform consistency regularization methods, while the opposite was supposed in previous work. Source code is available at
updated: Mon Jun 29 2020 08:18:31 GMT+0000 (UTC)
published: Thu Aug 08 2019 09:17:54 GMT+0000 (UTC)
