特に群衆のシナリオでは、人はさまざまな障害物や他の人によって塞がれることが多いため、遮られた人の再識別 (Re-ID) は困難な作業です。これらの問題に対処するために、ピクセル コンテキスト ベースのトランスフォーマー エンコーダーとパーツ プロトタイプ ベースのトランスフォーマーを含む、トランスフォーマー エンコーダー デコーダー アーキテクチャを介した多様なパーツの発見を通じて、閉塞された人の Re-ID 向けの新しいエンド ツー エンドのパーツ認識トランスフォーマー (PAT) を提案します。デコーダ。提案された PAT モデルには、いくつかのメリットがあります。まず、私たちの知る限り、これは統合された深層モデルでの被閉塞者の Re-ID にトランスフォーマー エンコーダー デコーダー アーキテクチャを活用する最初の作業です。次に、ID ラベルだけでパーツ プロトタイプをうまく学習するために、パーツの多様性とパーツの識別性を含む 2 つの効果的なメカニズムを設計します。これにより、弱い教師ありの方法で被閉塞者の Re-ID に対する多様な部位の発見を実現することができます。 3 つのタスク (閉塞、部分的および全体的な Re-ID) に対する 6 つの挑戦的なベンチマークに関する広範な実験結果は、提案された PAT が最先端の方法に対して良好に機能することを示しています。
Occluded person re-identification (Re-ID) is a challenging task as persons are frequently occluded by various obstacles or other persons, especially in the crowd scenario. To address these issues, we propose a novel end-to-end Part-Aware Transformer (PAT) for occluded person Re-ID through diverse part discovery via a transformer encoderdecoder architecture, including a pixel context based transformer encoder and a part prototype based transformer decoder. The proposed PAT model enjoys several merits. First, to the best of our knowledge, this is the first work to exploit the transformer encoder-decoder architecture for occluded person Re-ID in a unified deep model. Second, to learn part prototypes well with only identity labels, we design two effective mechanisms including part diversity and part discriminability. Consequently, we can achieve diverse part discovery for occluded person Re-ID in a weakly supervised manner. Extensive experimental results on six challenging benchmarks for three tasks (occluded, partial and holistic Re-ID) demonstrate that our proposed PAT performs favorably against stat-of-the-art methods.