arXiv reaDer
RGB赤外線人物の再識別のための双方向指数関数的角度トリプレット損失
Bi-directional Exponential Angular Triplet Loss for RGB-Infrared Person Re-Identification
RGB-赤外線人物の再識別(RGB-IR Re-ID)は、モダリティの不一致が大きな課題であるクロスモダリティマッチングの問題です。ほとんどの既存の作品は、ユークリッド距離ベースの制約を使用して、異なるモダリティからの画像の特徴間の不一致を解決します。ただし、これらの方法では、ユークリッド距離では埋め込みベクトル間の夾角を効果的に測定できないため、角度を区別する特徴の埋め込みを学習できません。角度的に識別可能な特徴空間は、埋め込みベクトルに基づいて人間の画像を分類するために重要であるため、この論文では、角度的に分離可能な共通特徴空間を学習するのに役立つ、双方向指数角度トリプレット損失という名前の新しいランキング損失関数を提案します。埋め込みベクトル間に含まれる角度を明示的に制約します。さらに、埋め込みベクトルの大きさを安定させて学習するために、共通空間バッチ正規化レイヤーを採用しています。 SYSU-MM01およびRegDBデータセットの定量的および定性的実験は、私たちの分析をサポートします。 SYSU-MM01データセットでは、ベースラインと比較して、ランク1の精度/ mAPのパフォーマンスが7.40%/ 11.46%から38.57%/ 38.61%に向上しています。提案された方法は、単一モダリティRe-IDのタスクに一般化でき、Market-1501データセットのランク1精度/ mAPを92.0%/ 81.7%から94.7%/ 86.6%に、82.6%/ 70.6%から改善します。 DukeMTMC-reIDデータセットで87.6%/ 77.1%になります。
RGB-Infrared person re-identification (RGB-IR Re- ID) is a cross-modality matching problem, where the modality discrepancy is a big challenge. Most existing works use Euclidean metric based constraints to resolve the discrepancy between features of images from different modalities. However, these methods are incapable of learning angularly discriminative feature embedding because Euclidean distance cannot measure the included angle between embedding vectors effectively. As an angularly discriminative feature space is important for classifying the human images based on their embedding vectors, in this paper, we propose a novel ranking loss function, named Bi-directional Exponential Angular Triplet Loss, to help learn an angularly separable common feature space by explicitly constraining the included angles between embedding vectors. Moreover, to help stabilize and learn the magnitudes of embedding vectors, we adopt a common space batch normalization layer. The quantitative and qualitative experiments on the SYSU-MM01 and RegDB dataset support our analysis. On SYSU-MM01 dataset, the performance is improved from 7.40% / 11.46% to 38.57% / 38.61% for rank-1 accuracy / mAP compared with the baseline. The proposed method can be generalized to the task of single-modality Re-ID and improves the rank-1 accuracy / mAP from 92.0% / 81.7% to 94.7% / 86.6% on the Market-1501 dataset, from 82.6% / 70.6% to 87.6% / 77.1% on the DukeMTMC-reID dataset.
updated: Mon Dec 14 2020 03:41:54 GMT+0000 (UTC)
published: Mon Jun 01 2020 12:26:08 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト