arXiv reaDer
監視なしのビデオ人物の再識別のためのグローバルカメラネットワークの制約の活用
Exploiting Global Camera Network Constraints for Unsupervised Video Person Re-identification
カメラ全体でのサンプルの注釈付けには時間がかかるため、最近、ビデオベースの再識別問題に対して多くの教師なしアプローチが提案されています。ただし、これらの方法ではカメラネットワーク全体の高次の関係が無視されるため、異なるカメラペアの一致結果を組み合わせると、矛盾した出力が発生します。このペーパーでは、一貫したクロスビューマッチング(CCM)フレームワークを提案することにより、監視されていないビデオベースの再識別の問題に対処します。このフレームワークでは、グローバルカメラネットワークの制約を利用して、一致したペアの一貫性を保証します。具体的には、まず、各サンプルの最初の近傍を利用して、サンプル間の関係を発見し、各カメラのグループを見つけることを提案します。さらに、グローバルなカメラネットワーク制約が続くクロスビューマッチング戦略が、カメラネットワーク全体のマッチング関係を調査するために提案されています。最後に、一貫したクロスビューマッチングペアを交互にマイニングし、これらの取得した一致を使用してメトリックモデルを更新することにより、カメラペアのメトリックモデルを段階的に学習します。ビデオの再識別のために広く使用されている2つのベンチマークに関する厳密な実験により、現在の最先端の監視されていない方法に対する提案された方法の優位性が実証されています。たとえば、MARSデータセットでは、ランク付けされた方法で、監視なしの方法よりも4.2%向上し、ワンショットの監視ベースの方法よりも2.5%向上しています。
Many unsupervised approaches have been proposed recently for the video-based re-identification problem since annotations of samples across cameras are time-consuming. However, higher-order relationships across the entire camera network are ignored by these methods, leading to contradictory outputs when matching results from different camera pairs are combined. In this paper, we address the problem of unsupervised video-based re-identification by proposing a consistent cross-view matching (CCM) framework, in which global camera network constraints are exploited to guarantee the matched pairs are with consistency. Specifically, we first propose to utilize the first neighbor of each sample to discover relations among samples and find the groups in each camera. Additionally, a cross-view matching strategy followed by global camera network constraints is proposed to explore the matching relationships across the entire camera network. Finally, we learn metric models for camera pairs progressively by alternatively mining consistent cross-view matching pairs and updating metric models using these obtained matches. Rigorous experiments on two widely-used benchmarks for video re-identification demonstrate the superiority of the proposed method over current state-of-the-art unsupervised methods; for example, on the MARS dataset, our method achieves an improvement of 4.2% over unsupervised methods, and even 2.5% over one-shot supervision-based methods for rank-1 accuracy.
updated: Sat Dec 12 2020 04:47:42 GMT+0000 (UTC)
published: Tue Aug 27 2019 22:35:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト