arXiv reaDer
CM-NAS:可視赤外線の再識別のためのクロスモダリティニューラルアーキテクチャ検索
CM-NAS: Cross-Modality Neural Architecture Search for Visible-Infrared Person Re-Identification
可視-赤外線人物の再識別(VI-ReID)は、暗い環境での単一モダリティの人物ReIDの制限を打ち破り、クロスモダリティの歩行者画像を照合することを目的としています。大きなモダリティの不一致の影響を軽減するために、既存の作業では、さまざまな2ストリームアーキテクチャを手動で設計して、モダリティ固有の表現とモダリティ共有可能な表現を別々に学習します。ただし、このような手動の設計ルーチンは、大規模な実験と経験的実践に大きく依存しており、時間と労力がかかります。このホワイトペーパーでは、手動で設計されたアーキテクチャを体系的に調査し、バッチ正規化(BN)レイヤーを適切に分離することが、クロスモダリティマッチングに大きな後押しをもたらす鍵であることを確認します。この観察に基づいて、本質的な目的は、各BN層に最適な分離スキームを見つけることです。この目的のために、Cross-Modality Neural Architecture Search(CM-NAS)という名前の新しい方法を提案します。これは、クロスモダリティタスクを条件として標準の最適化を実行できるBN指向の検索スペースで構成されています。検索されたアーキテクチャを備えたこの方法は、2つのベンチマークの両方で最先端の方法を上回り、SYSU-MM01ではランク-1 / mAPが6.70%/ 6.13%、RegDBでは12.17%/ 11.23%向上しています。そのシンプルさと有効性に照らして、CM-NASは将来の研究の強力なベースラインとして役立つと期待しています。コードが利用可能になります。
Visible-Infrared person re-identification (VI-ReID) aims to match cross-modality pedestrian images, breaking through the limitation of single-modality person ReID in dark environment. In order to mitigate the impact of large modality discrepancy, existing works manually design various two-stream architectures to separately learn modality-specific and modality-sharable representations. Such a manual design routine, however, highly depends on massive experiments and empirical practice, which is time consuming and labor intensive. In this paper, we systematically study the manually designed architectures, and identify that appropriately separating Batch Normalization (BN) layers is the key to bring a great boost towards cross-modality matching. Based on this observation, the essential objective is to find the optimal separation scheme for each BN layer. To this end, we propose a novel method, named Cross-Modality Neural Architecture Search (CM-NAS). It consists of a BN-oriented search space in which the standard optimization can be fulfilled subject to the cross-modality task. Equipped with the searched architecture, our method outperforms state-of-the-art counterparts in both two benchmarks, improving the Rank-1/mAP by 6.70%/6.13% on SYSU-MM01 and by 12.17%/11.23% on RegDB. In light of its simplicity and effectiveness, we expect CM-NAS will serve as a strong baseline for future research. Code will be made available.
updated: Thu Mar 18 2021 07:48:02 GMT+0000 (UTC)
published: Thu Jan 21 2021 07:07:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト