arXiv reaDer
MSO:RGB赤外線人物の再識別のための多機能空間共同最適化ネットワーク
MSO: Multi-Feature Space Joint Optimization Network for RGB-Infrared Person Re-Identification
RGB赤外線クロスモダリティ人物再識別(ReID)タスクは、可視モダリティと赤外線モダリティの間で同じIDの画像を認識することを目的としています。既存の方法では、主に2ストリームアーキテクチャを使用して、最終的な共通機能空間の2つのモダリティ間の不一致を排除します。これにより、浅いレイヤーの各モダリティの単一の空間が無視されます。それを解決するために、この論文では、単一モダリティ空間と共通空間の両方でモダリティ共有可能な機能を学習できる、新しい多機能空間共同最適化(MSO)ネットワークを提示します。まず、エッジ情報がモダリティ不変であるという観察に基づいて、各単一モダリティ空間でモダリティ共有可能な機能を強化するためのエッジ機能強化モジュールを提案します。具体的には、エッジ融合戦略分析後の知覚エッジ機能(PEF)損失を設計します。私たちの知識によると、これはクロスモダリティReIDタスクのシングルモダリティ特徴空間での明示的な最適化を提案する最初の作業です。さらに、クロスモダリティ距離とクラス距離の差を大きくするために、共通の特徴空間のモダリティジョイントコンストレイントに新しいクロスモダリティコントラストセンター(CMCC)損失を導入します。 PEF損失とCMCC損失は、エンドツーエンドの方法でモデルを共同で最適化し、ネットワークのパフォーマンスを大幅に向上させます。広範な実験により、提案されたモデルは、SYSU-MM01データセットとRegDBデータセットの両方で最先端の方法を大幅に上回っています。
The RGB-infrared cross-modality person re-identification (ReID) task aims to recognize the images of the same identity between the visible modality and the infrared modality. Existing methods mainly use a two-stream architecture to eliminate the discrepancy between the two modalities in the final common feature space, which ignore the single space of each modality in the shallow layers. To solve it, in this paper, we present a novel multi-feature space joint optimization (MSO) network, which can learn modality-sharable features in both the single-modality space and the common space. Firstly, based on the observation that edge information is modality-invariant, we propose an edge features enhancement module to enhance the modality-sharable features in each single-modality space. Specifically, we design a perceptual edge features (PEF) loss after the edge fusion strategy analysis. According to our knowledge, this is the first work that proposes explicit optimization in the single-modality feature space on cross-modality ReID task. Moreover, to increase the difference between cross-modality distance and class distance, we introduce a novel cross-modality contrastive-center (CMCC) loss into the modality-joint constraints in the common feature space. The PEF loss and CMCC loss jointly optimize the model in an end-to-end manner, which markedly improves the network's performance. Extensive experiments demonstrate that the proposed model significantly outperforms state-of-the-art methods on both the SYSU-MM01 and RegDB datasets.
updated: Thu Oct 21 2021 16:45:23 GMT+0000 (UTC)
published: Thu Oct 21 2021 16:45:23 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト