arXiv reaDer
相互識別知識伝達による画像からビデオへの再識別
Image-to-Video Re-Identification via Mutual Discriminative Knowledge Transfer
画像とビデオの間の表現のギャップは、画像からビデオへの再識別(I2V Re-ID)を困難にし、最近の研究では、この問題を知識蒸留(KD)プロセスとして定式化しています。本論文では、ビデオベースのより豊かな表現を画像ベースの表現により効果的に転送するための相互識別知識蒸留フレームワークを提案する。具体的には、KD用に設計された新しい損失であるトリプレットコントラスト損失(TCL)を提案します。 KDプロセス中に、TCL損失はローカル構造を転送し、高次の情報を利用し、教師と生徒のネットワークの異種出力の不整合を軽減します。 KDの他の損失と比較して、提案されたTCL損失は、ローカルの識別機能を教師から生徒に選択的に転送し、ReIDで効果的にします。 TCLの損失に加えて、教師と生徒の両方のネットワークトレーニングを定期的に行うために相互学習を採用しています。広範な実験により、MARS、DukeMTMC-VideoReID、およびVeRi-776ベンチマークでのメソッドの有効性が実証されています。
The gap in representations between image and video makes Image-to-Video Re-identification (I2V Re-ID) challenging, and recent works formulate this problem as a knowledge distillation (KD) process. In this paper, we propose a mutual discriminative knowledge distillation framework to transfer a video-based richer representation to an image based representation more effectively. Specifically, we propose the triplet contrast loss (TCL), a novel loss designed for KD. During the KD process, the TCL loss transfers the local structure, exploits the higher order information, and mitigates the misalignment of the heterogeneous output of teacher and student networks. Compared with other losses for KD, the proposed TCL loss selectively transfers the local discriminative features from teacher to student, making it effective in the ReID. Besides the TCL loss, we adopt mutual learning to regularize both the teacher and student networks training. Extensive experiments demonstrate the effectiveness of our method on the MARS, DukeMTMC-VideoReID and VeRi-776 benchmarks.
updated: Fri Jan 21 2022 21:04:39 GMT+0000 (UTC)
published: Fri Jan 21 2022 21:04:39 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト