人の再識別(re-id)の場合、注意メカニズムは、識別機能の強化と無関係な機能の抑制を目的としているため、魅力的となっており、re-idのキー、つまり識別機能学習によく一致しています。以前のアプローチは、通常、グローバル構造パターンからの知識のマイニングを無視して、ローカル畳み込みを使用して注意を学習します。直感的に、フィーチャマップの空間位置/ノード間の類似性はクラスタリングのような情報を提供し、意味論を推測するのに役立ち、したがって、特に実現可能な人間のポーズが制限されている人物の画像の場合は注意が必要です。この作業では、効果的なRelation-Aware Global Attention(RGA)モジュールを提案します。このモジュールは、より良い注意学習のためにグローバル構造情報をキャプチャします。具体的には、フィーチャの位置ごとに、グローバルスコープの構造情報とローカルの外観情報をコンパクトに把握するために、関係、つまりすべてのフィーチャの位置とのペアワイズ相関/アフィニティ(たとえば、ラスタースキャン順)をスタックすることを提案します。 、そして特徴自体を組み合わせて、浅い畳み込みモデルで注意を学びます。広範なアブレーション研究は、RGAが機能表現力を大幅に向上させ、いくつかの一般的なベンチマークで最先端のパフォーマンスを達成できることを示しています。ソースコードはhttps://github.com/microsoft/Relation-Aware-Global-Attention-Networksで入手できます。
For person re-identification (re-id), attention mechanisms have become attractive as they aim at strengthening discriminative features and suppressing irrelevant ones, which matches well the key of re-id, i.e., discriminative feature learning. Previous approaches typically learn attention using local convolutions, ignoring the mining of knowledge from global structure patterns. Intuitively, the affinities among spatial positions/nodes in the feature map provide clustering-like information and are helpful for inferring semantics and thus attention, especially for person images where the feasible human poses are constrained. In this work, we propose an effective Relation-Aware Global Attention (RGA) module which captures the global structural information for better attention learning. Specifically, for each feature position, in order to compactly grasp the structural information of global scope and local appearance information, we propose to stack the relations, i.e., its pairwise correlations/affinities with all the feature positions (e.g., in raster scan order), and the feature itself together to learn the attention with a shallow convolutional model. Extensive ablation studies demonstrate that our RGA can significantly enhance the feature representation power and help achieve the state-of-the-art performance on several popular benchmarks. The source code is available at https://github.com/microsoft/Relation-Aware-Global-Attention-Networks.