最近、群衆の数え方がますます注目を集めています。特に高密度環境の技術は重要な研究内容となっており、非常に密集した群集の存在に関連する方法は最適ではありません。この論文では、群集カウントのためのマルチレベルの注意深い畳み込みニューラルネットワーク(MLAttnCNN)を提案します。プーリングに適用された複数の異なるスケールで高レベルのコンテキスト情報を抽出し、マルチレベルのアテンションモジュールを使用してさまざまなレイヤーの特性を強化し、より効率的なマルチスケールの機能融合を実現します。これにより、より正確な生成が可能になります。拡張畳み込みと1×1畳み込みの密度マップ。 3つの利用可能な公開データセットでの広範な実験は、提案されたネットワークが最先端のアプローチよりも優れたパフォーマンスを達成することを示しています。
Recently the crowd counting has received more and more attention. Especially the technology of high-density environment has become an important research content, and the relevant methods for the existence of extremely dense crowd are not optimal. In this paper, we propose a multi-level attentive Convolutional Neural Network (MLAttnCNN) for crowd counting. We extract high-level contextual information with multiple different scales applied in pooling, and use multi-level attention modules to enrich the characteristics at different layers to achieve more efficient multi-scale feature fusion, which is able to be used to generate a more accurate density map with dilated convolutions and a 1×1 convolution. The extensive experiments on three available public datasets show that our proposed network achieves outperformance to the state-of-the-art approaches.