着替え人物再識別 (CC-ReID) は、着替えが発生する可能性があるときに、複数の監視カメラから対象人物を取得することを目的とした難しいタスクです。 CC-ReID の最近の進歩にも関わらず、既存のアプローチには、衣服に関係のない領域にモデルを一貫して焦点を当て続ける効果的な制約が欠けているため、衣服のバリエーションの干渉によって依然として妨げられています。この問題に対処するために、効果的な整合性制約を提案することでアイデンティティ関連のセマンティック機能を学習するための Semantic-aware Consistency Network (SCNet) を紹介します。具体的には、衣服領域のピクセルを消去することで黒い衣服の画像を生成します。これにより、衣服のバリエーションによる干渉が明示的に軽減されます。さらに、きめの細かいアイデンティティ情報を最大限に活用するために、頭部強化アテンション モジュールが導入されています。このモジュールは、提案されたパーツベースのマッチング損失を利用してソフト アテンション マップを学習し、頭部情報を強調表示します。さらに、高レベルのアイデンティティ関連の意味的特徴の学習を容易にするために意味的一貫性の損失を設計し、モデルが意味的に一貫したクロスに無関係な領域に焦点を当てるようにします。一貫性制約を使用することにより、私たちのモデルは、黒い服の画像を生成したり、推論段階で頭部領域を特定したりするための追加の補助セグメンテーション モジュールを必要としません。 4 つの着替え人物 Re-ID データセット (LTCC、PRCC、Vc-Clothes、および DeepChange) に関する広範な実験により、私たちが提案した SCNet が従来の最先端のアプローチに比べて大幅に改善されることが実証されました。私たちのコードは https://github.com/Gpn-star/SCNet で入手できます。
Cloth-changing Person Re-Identification (CC-ReID) is a challenging task that aims to retrieve the target person across multiple surveillance cameras when clothing changes might happen. Despite recent progress in CC-ReID, existing approaches are still hindered by the interference of clothing variations since they lack effective constraints to keep the model consistently focused on clothing-irrelevant regions. To address this issue, we present a Semantic-aware Consistency Network (SCNet) to learn identity-related semantic features by proposing effective consistency constraints. Specifically, we generate the black-clothing image by erasing pixels in the clothing area, which explicitly mitigates the interference from clothing variations. In addition, to fully exploit the fine-grained identity information, a head-enhanced attention module is introduced, which learns soft attention maps by utilizing the proposed part-based matching loss to highlight head information. We further design a semantic consistency loss to facilitate the learning of high-level identity-related semantic features, forcing the model to focus on semantically consistent cloth-irrelevant regions. By using the consistency constraint, our model does not require any extra auxiliary segmentation module to generate the black-clothing image or locate the head region during the inference stage. Extensive experiments on four cloth-changing person Re-ID datasets (LTCC, PRCC, Vc-Clothes, and DeepChange) demonstrate that our proposed SCNet makes significant improvements over prior state-of-the-art approaches. Our code is available at: https://github.com/Gpn-star/SCNet.