arXiv reaDer
多焦点ガウス近傍注意と大規模ベンチマークを使用したビデオ群集のローカリゼーション
Video Crowd Localization with Multi-focus Gaussian Neighborhood Attention and a Large-Scale Benchmark
ビデオ群集のローカリゼーションは、特定の群集ビデオ内の人間の頭の正確な位置を推定することを目的とした、重要かつ困難なタスクです。人間の移動の時空間依存性をモデル化するために、マルチフォーカス ガウス近傍注意 (GNA) を提案します。これは、入力ビデオの空間トポロジ構造を維持しながら、長距離対応を効果的に活用できます。特に当社のGNAは、搭載されたマルチフォーカス機構により、人間の頭部のスケール変化も良好に捉えることができます。マルチフォーカスGNAに基づいて、GNANetと呼ばれる統合ニューラルネットワークを開発し、シーンモデリングモジュールとコンテキストクロスアテンションモジュールを介して時空間情報を完全に集約することにより、ビデオクリップのヘッドセンターを正確に特定します。さらに、この分野での将来の研究を促進するために、さまざまな監視シナリオでキャプチャされた 60K 以上のフレームと 200 万以上の頭の注釈で構成される、VSCrowd という名前の大規模な群衆ビデオ ベンチマークを導入します。最後に、SenseCrowd を含む 3 つのデータセットで大規模な実験を行い、実験結果は、提案された方法がビデオ群集のローカリゼーションとカウントの両方で最先端のパフォーマンスを達成できることを示しています。
Video crowd localization is a crucial yet challenging task, which aims to estimate exact locations of human heads in the given crowded videos. To model spatial-temporal dependencies of human mobility, we propose a multi-focus Gaussian neighborhood attention (GNA), which can effectively exploit long-range correspondences while maintaining the spatial topological structure of the input videos. In particular, our GNA can also capture the scale variation of human heads well using the equipped multi-focus mechanism. Based on the multi-focus GNA, we develop a unified neural network called GNANet to accurately locate head centers in video clips by fully aggregating spatial-temporal information via a scene modeling module and a context cross-attention module. Moreover, to facilitate future researches in this field, we introduce a large-scale crowd video benchmark named VSCrowd, which consists of 60K+ frames captured in various surveillance scenarios and 2M+ head annotations. Finally, we conduct extensive experiments on three datasets including our SenseCrowd, and the experiment results show that the proposed method is capable to achieve state-of-the-art performance for both video crowd localization and counting.
updated: Mon Aug 08 2022 04:22:04 GMT+0000 (UTC)
published: Mon Jul 19 2021 06:59:27 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト