arXiv reaDer
ビデオパーソンの再識別のための参照支援部分整列機能の解きほぐし
Reference-Aided Part-Aligned Feature Disentangling for Video Person Re-Identification
最近、ビデオベースの個人再識別(re-ID)は、その実用的なアプリケーションの見通しのために、コンピューティングビジョンコミュニティでますます注目を集めています。不正確な人物の検出とポーズの変更により、歩行者の不整合により、特徴の抽出と照合が大幅に困難になります。この問題に対処するために、このペーパーでは、さまざまなパーツの堅牢な機能を解きほぐすための参照支援パーツ整列(RAPA)フレームワークを提案します。まず、異なるビデオ間のより良い参照を取得するために、ポーズベースの参照機能学習モジュールが導入されています。次に、効果的なリレーションベースのパーツ機能のもつれを解くモジュールを調べて、各ビデオ内のフレームを位置合わせします。両方のモジュールを使用することにより、ビデオ内の歩行者の有益な部分が適切に調整され、より識別力のある特徴表現が生成されます。広く使用されている3つのベンチマーク、つまりiLIDS-VID、PRID-2011、およびMARSデータセットに関する包括的な実験により、提案されたフレームワークの有効性が検証されます。私たちのコードは一般に公開されます。
Recently, video-based person re-identification (re-ID) has drawn increasing attention in compute vision community because of its practical application prospects. Due to the inaccurate person detections and pose changes, pedestrian misalignment significantly increases the difficulty of feature extraction and matching. To address this problem, in this paper, we propose a Reference-Aided Part-Aligned (RAPA) framework to disentangle robust features of different parts. Firstly, in order to obtain better references between different videos, a pose-based reference feature learning module is introduced. Secondly, an effective relation-based part feature disentangling module is explored to align frames within each video. By means of using both modules, the informative parts of pedestrian in videos are well aligned and more discriminative feature representation is generated. Comprehensive experiments on three widely-used benchmarks, i.e. iLIDS-VID, PRID-2011 and MARS datasets verify the effectiveness of the proposed framework. Our code will be made publicly available.
updated: Sun Mar 21 2021 06:53:57 GMT+0000 (UTC)
published: Sun Mar 21 2021 06:53:57 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト