arXiv reaDer
画像分類のための数十億規模の半教師付き学習
Billion-scale semi-supervised learning for image classification
本論文では、大規模畳み込みネットワークを用いた半教師付き学習の研究を紹介する。我々は、教師/生徒パラダイムに基づいて、ラベル付けされていない画像の大規模なコレクション(最大10億枚)を利用したパイプラインを提案する。我々の主な目標は、ResNet-50やResNextのような特定のターゲットアーキテクチャの性能を向上させることである。我々のアプローチの成功要因を広範に分析し、半教師付き学習を用いた画像分類のための高精度モデルを生成するためのいくつかの提案を行う。その結果、我々のアプローチは、画像、ビデオ、細粒度分類のための標準的なアーキテクチャに重要な利益をもたらす。例えば、10億枚のラベル付けされていない画像を利用して、我々の学習済みバニラResNet-50は、ImageNetベンチマークで81.2%のトップ1の精度を達成した。
This paper presents a study of semi-supervised learning with large convolutional networks. We propose a pipeline, based on a teacher/student paradigm, that leverages a large collection of unlabelled images (up to 1 billion). Our main goal is to improve the performance for a given target architecture, like ResNet-50 or ResNext. We provide an extensive analysis of the success factors of our approach, which leads us to formulate some recommendations to produce high-accuracy models for image classification with semi-supervised learning. As a result, our approach brings important gains to standard architectures for image, video and fine-grained classification. For instance, by leveraging one billion unlabelled images, our learned vanilla ResNet-50 achieves 81.2% top-1 accuracy on the ImageNet benchmark.
updated: Thu May 02 2019 02:08:18 GMT+0000 (UTC)
published: Thu May 02 2019 02:08:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト