arXiv reaDer
半教師あり学習への勤勉なアプローチ
A Studious Approach to Semi-Supervised Learning
ラベルのないデータを大量に使用しながら、いくつかのラベルの付いた例から学習するという問題は、さまざまな半教師あり方法によって対処されてきました。これらの方法は優れたパフォーマンスを実現できますが、パラメーターの数が多いため、モデルをデプロイできないことがよくあります。この論文は、半教師あり設定での蒸留のアブレーション研究であり、モデルのパラメーターの数を減らすだけでなく、ベースラインの監視ありモデルよりもパフォーマンスを向上させ、一般化を改善しながらこれを実現できます。教師あり事前トレーニングの後、ネットワークは教師モデルとして使用され、学生ネットワークは、教師モデルがラベルなしデータ全体に対して生成するソフトラベルを介してトレーニングされます。ラベルが少なければ少ないほど、このアプローチはより小さな学生ネットワークからより多くの利益を得ることがわかります。これにより、展開可能性を維持しながら、半教師ありコンピュータービジョンタスクのパフォーマンスを向上させる効果的なソリューションとして、蒸留の可能性がもたらされます。
The problem of learning from few labeled examples while using large amounts of unlabeled data has been approached by various semi-supervised methods. Although these methods can achieve superior performance, the models are often not deployable due to the large number of parameters. This paper is an ablation study of distillation in a semi-supervised setting, which not just reduces the number of parameters of the model but can achieve this while improving the performance over the baseline supervised model and making it better at generalizing. After the supervised pretraining, the network is used as a teacher model, and a student network is trained over the soft labels that the teacher model generates over the entire unlabeled data. We find that the fewer the labels, the more this approach benefits from a smaller student network. This brings forward the potential of distillation as an effective solution to enhance performance in semi-supervised computer vision tasks while maintaining deployability.
updated: Sat Sep 18 2021 12:48:47 GMT+0000 (UTC)
published: Sat Sep 18 2021 12:48:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト