arXiv reaDer
ViTからの無料ランチ:きめ細かい視覚認識のためのアダプティブアテンションマルチスケールフュージョントランスフォーマー
A free lunch from ViT:Adaptive Attention Multi-scale Fusion Transformer for Fine-grained Visual Recognition
オブジェクトのパーツに関する微妙な表現を学習することは、きめ細かい視覚認識(FGVR)の分野で重要な役割を果たします。ビジョントランスフォーマー(ViT)は、その注意メカニズムにより、コンピュータービジョンで有望な結果を達成します。それにもかかわらず、ViTのパッチのサイズが固定されているため、深層のクラストークンはグローバルな受容野に焦点を合わせており、FGVRのマルチグラニュラリティ機能を生成できません。ボックス注釈なしで領域の注意をキャプチャし、FGVRのViTの欠点を補うために、アダプティブアテンションマルチスケールフュージョントランスフォーマー(AFTrans)という新しい方法を提案します。私たちのアプローチの選択的注意収集モジュール(SACM)は、ViTの注意の重みを活用し、入力パッチの相対的な重要性に対応するようにそれらを適応的にフィルタリングします。複数のスケール(グローバルおよびローカル)パイプラインは、ウェイトシェアリングエンコーダーによって監視され、エンドツーエンドで簡単にトレーニングできます。包括的な実験により、AFTransは、公開されている3つのきめ細かいベンチマーク(CUB-200-2011、Stanford Dogs、iNat2017)でSOTAパフォーマンスを達成できることが実証されています。
Learning subtle representation about object parts plays a vital role in fine-grained visual recognition (FGVR) field. The vision transformer (ViT) achieves promising results on computer vision due to its attention mechanism. Nonetheless, with the fixed size of patches in ViT, the class token in deep layer focuses on the global receptive field and cannot generate multi-granularity features for FGVR. To capture region attention without box annotations and compensate for ViT shortcomings in FGVR, we propose a novel method named Adaptive attention multi-scale Fusion Transformer (AFTrans). The Selective Attention Collection Module (SACM) in our approach leverages attention weights in ViT and filters them adaptively to correspond with the relative importance of input patches. The multiple scales (global and local) pipeline is supervised by our weights sharing encoder and can be easily trained end-to-end. Comprehensive experiments demonstrate that AFTrans can achieve SOTA performance on three published fine-grained benchmarks: CUB-200-2011, Stanford Dogs and iNat2017.
updated: Mon Oct 11 2021 08:26:19 GMT+0000 (UTC)
published: Mon Oct 04 2021 08:11:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト