教師なし可視赤外線人物再識別 (USL-VI-ReID) は、異なるモダリティからの同じ身元の歩行者画像を注釈なしで照合することを目的としています。既存の研究は主に、ラベルのないサンプルのインスタンスレベルの特徴を調整することによってモダリティのギャップを緩和することに焦点を当てています。ただし、クロスモダリティクラスター間の関係は十分に調査されていません。この目的を達成するために、クロスモダリティクラスターをマッチングすることでモダリティギャップを削減する、新しい双方向クラスターマッチングベースの学習フレームワークを提案します。具体的には、二部グラフにおける最大マッチング問題を最適化することにより、多対多双方向クロスモダリティ クラスター マッチング (MBCCM) アルゴリズムを設計します。次に、一致したペアワイズ クラスターは、モデルのトレーニング中に共有の可視および赤外線の擬似ラベルを利用します。このような監視信号の下では、クラスター レベルで特徴を共同で調整するためのモダリティ固有およびモダリティ非依存 (MSMA) 対照学習フレームワークが提案されています。一方、モダリティ間の大きな不一致を明示的に削減するために、クロスモダリティ一貫性制約 (CC) が提案されています。公開されている SYSU-MM01 および RegDB データセットに対する広範な実験により、提案された方法の有効性が実証され、平均 8.76% mAP という大差で最先端のアプローチを上回りました。
Unsupervised visible-infrared person re-identification (USL-VI-ReID) aims to match pedestrian images of the same identity from different modalities without annotations. Existing works mainly focus on alleviating the modality gap by aligning instance-level features of the unlabeled samples. However, the relationships between cross-modality clusters are not well explored. To this end, we propose a novel bilateral cluster matching-based learning framework to reduce the modality gap by matching cross-modality clusters. Specifically, we design a Many-to-many Bilateral Cross-Modality Cluster Matching (MBCCM) algorithm through optimizing the maximum matching problem in a bipartite graph. Then, the matched pairwise clusters utilize shared visible and infrared pseudo-labels during the model training. Under such a supervisory signal, a Modality-Specific and Modality-Agnostic (MSMA) contrastive learning framework is proposed to align features jointly at a cluster-level. Meanwhile, the cross-modality Consistency Constraint (CC) is proposed to explicitly reduce the large modality discrepancy. Extensive experiments on the public SYSU-MM01 and RegDB datasets demonstrate the effectiveness of the proposed method, surpassing state-of-the-art approaches by a large margin of 8.76% mAP on average.