このホワイトペーパーでは、半教師あり学習(SSL)を利用してトレーニングデータの量を増やし、Fine-Grained Visual Categorization(FGVC)のパフォーマンスを向上させます。この問題は、FGVCが要求する法外な注釈コストにもかかわらず、過去に調査されていません。私たちのアプローチは、内部特徴表現が2次プーリングモデルで取得される敵対的最適化戦略でラベルなしデータを活用します。この組み合わせにより、2次プーリングで表されるパーツの情報を、敵対的なトレーニング設定でラベルのないデータに逆伝播することができます。航空機、スタンフォードカー、CUB-200-2011、オックスフォードフラワー、スタンフォードドッグ、最近の半教師ありを含む6つの最先端のきめ細かいデータセットで実験を行うことにより、組み合わせ使用の有効性を示します。 iNaturalist-Aves。実験結果は、提案された方法がこの問題を調べた唯一の以前のアプローチよりも優れた性能を持っていることを明確に示しています。また、比較した教師あり学習方法に関して、より高い分類精度が得られました。
In this paper we exploit Semi-Supervised Learning (SSL) to increase the amount of training data to improve the performance of Fine-Grained Visual Categorization (FGVC). This problem has not been investigated in the past in spite of prohibitive annotation costs that FGVC requires. Our approach leverages unlabeled data with an adversarial optimization strategy in which the internal features representation is obtained with a second-order pooling model. This combination allows to back-propagate the information of the parts, represented by second-order pooling, onto unlabeled data in an adversarial training setting. We demonstrate the effectiveness of the combined use by conducting experiments on six state-of-the-art fine-grained datasets, which include Aircrafts, Stanford Cars, CUB-200-2011, Oxford Flowers, Stanford Dogs, and the recent Semi-Supervised iNaturalist-Aves. Experimental results clearly show that our proposed method has better performance than the only previous approach that examined this problem; it also obtained higher classification accuracy with respect to the supervised learning methods with which we compared.