BiSTF: Bilateral-Branch Self-Training Framework for Semi-Supervised Large-scale Fine-Grained Recognition
半教師あり細粒度認識は、データの不均衡、高いクラス間類似性、およびドメインの不一致が難しいため、課題となるタスクです。近年、この分野は大きな進歩を遂げ、多くの方法が大きな成果を上げています。ただし、これらの方法は、Semi-iNatなどの大規模なデータセットに一般化することはほとんどできません。これは、ラベルのないデータのノイズや、不均衡な細粒度データから機能を学習する能力がないためです。この作業では、クラス不均衡およびドメインシフトのきめ細かいデータに関する既存の半教師あり学習方法を改善するためのシンプルで効果的なフレームワークであるBilateral-Branch Self-Training Framework(BiSTF)を提案します。確率的エポック更新を通じて更新頻度を調整することにより、BiSTFは、ラベルなしセットから疑似ラベル付きサンプルを選択的に追加することによって拡張されたラベル付きセットを使用してベースラインSSLモデルを繰り返し再トレーニングします。ここで、疑似ラベル付きサンプルの分布はラベル付きデータと同じです。 BiSTFがSemi-iNatデータセットの既存の最先端SSLアルゴリズムよりも優れていることを示します。
Semi-supervised Fine-Grained Recognition is a challenge task due to the difficulty of data imbalance, high inter-class similarity and domain mismatch. Recent years, this field has witnessed great progress and many methods has gained great performance. However, these methods can hardly generalize to the large-scale datasets, such as Semi-iNat, as they are prone to suffer from noise in unlabeled data and the incompetence for learning features from imbalanced fine-grained data. In this work, we propose Bilateral-Branch Self-Training Framework (BiSTF), a simple yet effective framework to improve existing semi-supervised learning methods on class-imbalanced and domain-shifted fine-grained data. By adjusting the update frequency through stochastic epoch update, BiSTF iteratively retrains a baseline SSL model with a labeled set expanded by selectively adding pseudo-labeled samples from an unlabeled set, where the distribution of pseudo-labeled samples are the same as the labeled data. We show that BiSTF outperforms the existing state-of-the-art SSL algorithm on Semi-iNat dataset.
updated: Wed Jul 14 2021 15:28:54 GMT+0000 (UTC)
published: Wed Jul 14 2021 15:28:54 GMT+0000 (UTC)
