ラベルなしデータを使用して完全な教師あり学習のパフォーマンスに到達し、クラスごとに1つのサンプルのみにラベルを付けることは、深層学習アプリケーションに理想的です。完全教師あり学習に匹敵するテスト精度を達成するために、Cifar-10およびSVHNでワンショット半教師あり(BOSS)学習を構築する可能性を初めて示します。私たちの方法は、クラスプロトタイプの改良、クラスバランシング、およびセルフトレーニングを組み合わせたものです。適切なプロトタイプの選択が不可欠であり、象徴的な例を取得するための手法を提案します。さらに、クラスバランシング手法により、半教師あり学習の精度が大幅に向上し、自己トレーニングが完全な教師あり学習のパフォーマンスのレベルに到達できることを示します。厳密な経験的評価は、ディープニューラルネットワークのトレーニングに大きなデータセットのラベル付けが必要ないという証拠を提供します。コードをhttps://github.com/lnsmith54/BOSSで利用できるようにして、レプリケーションを容易にし、将来の実際のアプリケーションで使用できるようにしました。
Reaching the performance of fully supervised learning with unlabeled data and only labeling one sample per class might be ideal for deep learning applications. We demonstrate for the first time the potential for building one-shot semi-supervised (BOSS) learning on Cifar-10 and SVHN up to attain test accuracies that are comparable to fully supervised learning. Our method combines class prototype refining, class balancing, and self-training. A good prototype choice is essential and we propose a technique for obtaining iconic examples. In addition, we demonstrate that class balancing methods substantially improve accuracy results in semi-supervised learning to levels that allow self-training to reach the level of fully supervised learning performance. Rigorous empirical evaluations provide evidence that labeling large datasets is not necessary for training deep neural networks. We made our code available at https://github.com/lnsmith54/BOSS to facilitate replication and for use with future real-world applications.