arXiv reaDer
きめ細かい認識のためのモバイルネットワークにおけるプログレッシブマルチステージインタラクティブトレーニング
Progressive Multi-stage Interactive Training in Mobile Network for Fine-grained Recognition
きめ細かい視覚分類(FGVC)は、サブカテゴリからオブジェクトを識別することを目的としています。クラス間の微妙な違いのため、これは非常に困難な作業です。既存の研究では、特徴抽出器として大規模な畳み込みニューラルネットワークまたはビジュアルトランスフォーマーを適用していますが、これは非常に計算コストが高くなります。実際、きめ細かい認識の実際のシナリオでは、オフラインで利用できるより軽量のモバイルネットワークが必要になることがよくあります。ただし、基本的なモバイルネットワークの特徴抽出機能は、大規模モデルよりも脆弱です。本論文では、軽量MobilenetV2に基づいて、再帰的モザイクジェネレータ(RMG-PMSI)を使用したプログレッシブマルチステージインタラクティブトレーニング方法を提案します。まず、さまざまなフェーズでさまざまな粒度の画像を生成する再帰的モザイクジェネレータ(RMG)を提案します。次に、さまざまなステージの機能がマルチステージインタラクション(MSI)モジュールを通過します。このモジュールは、さまざまなステージの対応する機能を強化および補完します。最後に、プログレッシブトレーニング(P)を使用して、さまざまな段階でモデルによって抽出された特徴を十分に活用し、相互に融合させることができます。 3つの一流のきめ細かいベンチマークでの実験は、RMG-PMSIが優れた堅牢性と転送可能性でパフォーマンスを大幅に改善できることを示しています。
Fine-grained Visual Classification (FGVC) aims to identify objects from subcategories. It is a very challenging task because of the subtle inter-class differences. Existing research applies large-scale convolutional neural networks or visual transformers as the feature extractor, which is extremely computationally expensive. In fact, real-world scenarios of fine-grained recognition often require a more lightweight mobile network that can be utilized offline. However, the fundamental mobile network feature extraction capability is weaker than large-scale models. In this paper, based on the lightweight MobilenetV2, we propose a Progressive Multi-Stage Interactive training method with a Recursive Mosaic Generator (RMG-PMSI). First, we propose a Recursive Mosaic Generator (RMG) that generates images with different granularities in different phases. Then, the features of different stages pass through a Multi-Stage Interaction (MSI) module, which strengthens and complements the corresponding features of different stages. Finally, using the progressive training (P), the features extracted by the model in different stages can be fully utilized and fused with each other. Experiments on three prestigious fine-grained benchmarks show that RMG-PMSI can significantly improve the performance with good robustness and transferability.
updated: Wed Dec 08 2021 10:50:03 GMT+0000 (UTC)
published: Wed Dec 08 2021 10:50:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト