arXiv reaDer
ギャップを埋める: 可視赤外線人物再識別のためのマルチレベルクロスモダリティジョイントアライメント
Bridging the Gap: Multi-Level Cross-Modality Joint Alignment for Visible-Infrared Person Re-Identification
可視赤外線人物再識別 (VI-ReID) は、可視カメラと赤外線カメラにまたがって歩行者の画像を照合することを目的とした、課題をまたいだクロスモダリティ画像検索タスクです。モダリティギャップを解決するために、既存の主流の方法は、画像検索タスクをクロスエントロピー損失と補助メトリック学習損失を伴う画像分類タスクに変換する学習パラダイムを採用しています。これらの損失は、抽出されたエンベディングの分布を調整してクラス内の距離を減らし、クラス間の距離を増やすという戦略に従います。ただし、そのような目標は検索タスクの最終テスト設定に正確に対応していないため、最適化レベルで新たなギャップが生じます。 VI-ReID のこれらの鍵を再考することにより、モダリティと目的レベルの両方のギャップを埋める、シンプルで効果的な方法であるマルチレベルクロスモダリティジョイントアライメント (MCJA) を提案します。前者については、加重グレースケール、クロスチャネル カットミックス、スペクトル ジッター拡張という 3 つの新しい戦略で構成されるモダリティ アライメント拡張を設計し、画像空間内のモダリティの不一致を効果的に削減します。後者については、新しいクロスモダリティ検索損失を導入します。テスト段階の目的に合わせて、ランキングリストの観点から制約を設けた初めての作品です。さらに、グローバル特徴のみに基づいて、私たちの手法は優れたパフォーマンスを示し、VI-ReID コミュニティの強力なベースライン手法として機能します。
Visible-Infrared person Re-IDentification (VI-ReID) is a challenging cross-modality image retrieval task that aims to match pedestrians' images across visible and infrared cameras. To solve the modality gap, existing mainstream methods adopt a learning paradigm converting the image retrieval task into an image classification task with cross-entropy loss and auxiliary metric learning losses. These losses follow the strategy of adjusting the distribution of extracted embeddings to reduce the intra-class distance and increase the inter-class distance. However, such objectives do not precisely correspond to the final test setting of the retrieval task, resulting in a new gap at the optimization level. By rethinking these keys of VI-ReID, we propose a simple and effective method, the Multi-level Cross-modality Joint Alignment (MCJA), bridging both modality and objective-level gap. For the former, we design the Modality Alignment Augmentation, which consists of three novel strategies, the weighted grayscale, cross-channel cutmix, and spectrum jitter augmentation, effectively reducing modality discrepancy in the image space. For the latter, we introduce a new Cross-Modality Retrieval loss. It is the first work to constrain from the perspective of the ranking list, aligning with the goal of the testing stage. Moreover, based on the global feature only, our method exhibits good performance and can serve as a strong baseline method for the VI-ReID community.
updated: Mon Jul 17 2023 08:24:05 GMT+0000 (UTC)
published: Mon Jul 17 2023 08:24:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト