Attribute-Aware Attention Model for Fine-grained Representation Learning
 識別用のきめの細かい表現を学習する方法は、個人の再識別、きめの細かい分類、きめの細かい画像検索など、多くのコンピュータビジョンアプリケーションの重要なポイントです。これまでの方法のほとんどは、メトリックまたはアンサンブルの学習に焦点を当てています通常はローカル情報の欠如である、より良いグローバル表現を導き出すため。上記の考慮事項に基づいて、ローカル属性表現とグローバルカテゴリ表現をエンドツーエンドで同時に学習できる新しい属性認識アテンションモデル(A ^ 3M)を提案します。提案モデルには2つのアテンションモデルが含まれます:属性ガイド付きアテンションモジュールは、属性情報を使用して異なる地域のカテゴリフィーチャを選択するのに役立ちます。同時に、カテゴリガイド付きアテンションモジュールは、カテゴリキューを使用して異なる属性のローカルフィーチャを選択します。この属性カテゴリの相互プロセスにより、ローカル機能とグローバル機能は互いに恩恵を受けます。最後に、結果の機能には、ノイズの多い無関係な機能の代わりに、画像認識のためのより本質的な情報が含まれます。 Market-1501、CompCars、CUB-200-2011、およびCARS196で行われた広範な実験は、A ^ 3Mの有効性を実証しています。コードはで入手できます。
How to learn a discriminative fine-grained representation is a key point in many computer vision applications, such as person re-identification, fine-grained classification, fine-grained image retrieval, etc. Most of the previous methods focus on learning metrics or ensemble to derive better global representation, which are usually lack of local information. Based on the considerations above, we propose a novel Attribute-Aware Attention Model (A^3M), which can learn local attribute representation and global category representation simultaneously in an end-to-end manner. The proposed model contains two attention models: attribute-guided attention module uses attribute information to help select category features in different regions, at the same time, category-guided attention module selects local features of different attributes with the help of category cues. Through this attribute-category reciprocal process, local and global features benefit from each other. Finally, the resulting feature contains more intrinsic information for image recognition instead of the noisy and irrelevant features. Extensive experiments conducted on Market-1501, CompCars, CUB-200-2011 and CARS196 demonstrate the effectiveness of our A^3M. Code is available at
updated: Fri Dec 20 2019 12:29:29 GMT+0000 (UTC)
published: Wed Jan 02 2019 14:22:59 GMT+0000 (UTC)
