arXiv reaDer
マルチラベル画像認識のためのマルチクラス注目領域を発見することを学ぶ
Learning to Discover Multi-Class Attentional Regions for Multi-Label Image Recognition
マルチラベルの画像認識は、シングルラベルの画像分類に比べて実用的で困難な作業です。ただし、オブジェクトの提案や複雑な注意領域生成モジュールの数が多いため、以前の研究は最適ではない可能性があります。この論文では、人間がオブジェクトを知覚する方法と同様に、グローバル イメージからローカル領域までマルチカテゴリ オブジェクトを認識するためのシンプルで効率的な 2 ストリーム フレームワークを提案します。グローバルストリームとローカルストリームの間のギャップを埋めるために、注意領域の数をできるだけ少なくし、これらの領域の多様性を可能な限り高く保つことを目的とした、マルチクラスの注意領域モジュールを提案します。私たちの方法は、手頃な計算コストとパラメーターのない領域ローカリゼーション モジュールを使用して、マルチクラス オブジェクトを効率的かつ効果的に認識できます。マルチラベル画像分類に関する 3 つのベンチマークを超えて、ラベルに依存しない画像セマンティクスのみを使用して、単一のモデルで新しい最先端の結果を作成します。さらに、提案された方法の有効性は、グローバル プーリング戦略、入力サイズ、ネットワーク アーキテクチャなどのさまざまな要因の下で広く実証されています。コードは ~https://github.com/gaobb/MCAR で入手できます。
Multi-label image recognition is a practical and challenging task compared to single-label image classification. However, previous works may be suboptimal because of a great number of object proposals or complex attentional region generation modules. In this paper, we propose a simple but efficient two-stream framework to recognize multi-category objects from global image to local regions, similar to how human beings perceive objects. To bridge the gap between global and local streams, we propose a multi-class attentional region module which aims to make the number of attentional regions as small as possible and keep the diversity of these regions as high as possible. Our method can efficiently and effectively recognize multi-class objects with an affordable computation cost and a parameter-free region localization module. Over three benchmarks on multi-label image classification, we create new state-of-the-art results with a single model only using image semantics without label dependency. In addition, the effectiveness of the proposed method is extensively demonstrated under different factors such as global pooling strategy, input size and network architecture. Code has been made available at~https://github.com/gaobb/MCAR.
updated: Wed Jun 09 2021 08:27:59 GMT+0000 (UTC)
published: Fri Jul 03 2020 15:22:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト