arXiv reaDer
可視赤外線人物の再識別のための補助学習タスクとしてのポーズ推定の調査について
On Exploring Pose Estimation as an Auxiliary Learning Task for Visible-Infrared Person Re-identification
可視赤外線モダリティと赤外線モダリティの間に大きな不一致が存在するため、可視赤外線人物の再識別(VI-ReID)は困難でした。ほとんどの先駆的なアプローチは、モダリティ共有およびID関連の機能を学習することにより、クラス内の変動とモダリティ間の不一致を減らします。ただし、明示的なモダリティ共有キュー、つまりボディキーポイントは、VI-ReIDでは十分に活用されていません。さらに、既存の機能学習パラダイムは、グローバル機能またはパーティション化された機能ストライプのいずれかに制約を課し、グローバル機能とパーツ機能の予測の一貫性を無視します。上記の問題に対処するために、エンドツーエンドのフレームワークでVI-ReIDタスクを支援するための補助学習タスクとしてポーズ推定を活用します。これらの2つのタスクを相互に有益な方法で共同でトレーニングすることにより、モデルはより高品質のモダリティ共有およびID関連の機能を学習します。さらに、グローバル機能とローカル機能の学習は、階層的機能制約(HFC)によってシームレスに同期され、前者は知識蒸留戦略を使用して後者を監視します。 2つのベンチマークVI-ReIDデータセットの実験結果は、提案された方法が一貫して最先端の方法を大幅に改善することを示しています。具体的には、私たちの方法は、RegDBデータセットの最先端の方法に対してほぼ20%のmAPの改善を達成します。私たちの興味深い発見は、VI-ReIDでの補助タスク学習の使用法を浮き彫りにしています。
Visible-infrared person re-identification (VI-ReID) has been challenging due to the existence of large discrepancies between visible and infrared modalities. Most pioneering approaches reduce intra-class variations and inter-modality discrepancies by learning modality-shared and ID-related features. However, an explicit modality-shared cue, i.e., body keypoints, has not been fully exploited in VI-ReID. Additionally, existing feature learning paradigms imposed constraints on either global features or partitioned feature stripes, which neglect the prediction consistency of global and part features. To address the above problems, we exploit Pose Estimation as an auxiliary learning task to assist the VI-ReID task in an end-to-end framework. By jointly training these two tasks in a mutually beneficial manner, our model learns higher quality modality-shared and ID-related features. On top of it, the learnings of global features and local features are seamlessly synchronized by Hierarchical Feature Constraint (HFC), where the former supervises the latter using the knowledge distillation strategy. Experimental results on two benchmark VI-ReID datasets show that the proposed method consistently improves state-of-the-art methods by significant margins. Specifically, our method achieves nearly 20% mAP improvements against the state-of-the-art method on the RegDB dataset. Our intriguing findings highlight the usage of auxiliary task learning in VI-ReID.
updated: Wed Feb 23 2022 09:28:07 GMT+0000 (UTC)
published: Tue Jan 11 2022 09:44:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト