Intra-clip Aggregation for Video Person Re-identification
ビデオベースの人物の再識別は、ビデオ監視におけるその広範なアプリケーションにより、近年大きな注目を集めています。ディープラーニングベースの方法は大きな進歩をもたらしましたが、これらの方法は、トレーニングプロセスで必要なデータの増大が原因である補足情報を効果的に使用しないことによって制限されています。データ拡張は、過剰適合トラップを軽減し、ネットワーク表現の能力を向上させるために広く使用されています。ただし、以前の方法では、画像ベースのデータ拡張方式を採用して入力フレームを個別に処理します。これにより、連続するフレーム間の補足情報が破損し、パフォーマンスが低下します。 3つのベンチマークデータセットでの広範な実験により、当社のフレームワークが最新の最先端の方法よりも優れていることが示されています。また、データセット間の検証を実行して、メソッドの一般性を証明します。
Video-based person re-identification has drawn massive attention in recent years due to its extensive applications in video surveillance. While deep learning-based methods have led to significant progress, these methods are limited by ineffectively using complementary information, which is blamed on necessary data augmentation in the training process. Data augmentation has been widely used to mitigate the over-fitting trap and improve the ability of network representation. However, the previous methods adopt image-based data augmentation scheme to individually process the input frames, which corrupts the complementary information between consecutive frames and causes performance degradation. Extensive experiments on three benchmark datasets demonstrate that our framework outperforms the most recent state-of-the-art methods. We also perform cross-dataset validation to prove the generality of our method.
updated: Sun Mar 14 2021 02:52:18 GMT+0000 (UTC)
published: Sun May 05 2019 17:37:33 GMT+0000 (UTC)
