arXiv reaDer
LDC-Net:密集した群衆のローカリゼーション、検出、およびカウントのための統合フレームワーク
LDC-Net: A Unified Framework for Localization, Detection and Counting in Dense Crowds
視覚的な群集分析の急速な発展は、単に密度マップを合計するのではなく、位置を特定したり、検出したりすることで人を数える傾向を示しています。また、フィールドの本質であるカウントする検出に戻ることもできます。これにより、より豊富な群集情報を提供でき、より実用的なアプリケーションを利用できます。ただし、群集のローカリゼーションと検出に関する最近の作業には、2つの制限があります。1)一般的な検出方法では、密集した群集と規模の大きな変動を処理できません。 2)密度マップヒューリスティック手法は、特に高密度または大規模な群集において、位置およびボックスの予測におけるパフォーマンスの欠陥に悩まされています。このホワイトペーパーでは、密集した群集の位置、検出、およびカウントに合わせたベースラインを考案します。これは、便宜上LDC-Netと呼ばれ、次の機能を備えています。1)予測のみでオブジェクトを検出する、強力でありながら最小限のパラダイムロケーションマップとサイズマップ。任意の容量(0〜10,000人以上)のシーンで検出する機能を備えています。 2)0〜100,000 +ピクセルの範囲のヘッドなど、大きな変動に直面する際の優れたクロススケール能力。 3)密度ベースの方法と比較して、位置およびボックスの予測タスクで優れたパフォーマンスを実現し、競争力のあるカウントパフォーマンスを実現します。最後に、ソースコードと事前トレーニング済みモデルがリリースされます。
The rapid development in visual crowd analysis shows a trend to count people by positioning or even detecting, rather than simply summing a density map. It also enlightens us back to the essence of the field, detection to count, which can give more abundant crowd information and has more practical applications. However, some recent work on crowd localization and detection has two limitations: 1) The typical detection methods can not handle the dense crowds and a large variation in scale; 2) The density map heuristic methods suffer from performance deficiency in position and box prediction, especially in high density or large-size crowds. In this paper, we devise a tailored baseline for dense crowds location, detection, and counting from a new perspective, named as LDC-Net for convenience, which has the following features: 1) A strong but minimalist paradigm to detect objects by only predicting a location map and a size map, which endows an ability to detect in a scene with any capacity (0 ∼10,000+ persons); 2) Excellent cross-scale ability in facing a large variation, such as the head ranging in 0 ∼100,000+ pixels; 3) Achieve superior performance in location and box prediction tasks, as well as a competitive counting performance compared with the density-based methods. Finally, the source code and pre-trained models will be released.
updated: Sun Oct 10 2021 07:55:44 GMT+0000 (UTC)
published: Sun Oct 10 2021 07:55:44 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト