arXiv reaDer
群集カウントのためのマルチレベルの注意深い自発的ニューラルネットワーク
Multi-Level Attentive Convoluntional Neural Network for Crowd Counting
最近、群衆の数え方がますます注目を集めています。特に高密度環境の技術は重要な研究内容となっており、非常に密集した群集の存在に関連する方法は最適ではありません。この論文では、群集カウントのためのマルチレベルの注意深い畳み込みニューラルネットワーク(MLAttnCNN)を提案します。プーリングに適用された複数の異なるスケールで高レベルのコンテキスト情報を抽出し、マルチレベルのアテンションモジュールを使用してさまざまなレイヤーの特性を強化し、より効率的なマルチスケールの機能融合を実現します。これにより、より正確な生成が可能になります。拡張畳み込みと1×1畳み込みの密度マップ。 3つの利用可能な公開データセットでの広範な実験は、提案されたネットワークが最先端のアプローチよりも優れたパフォーマンスを達成することを示しています。
Recently the crowd counting has received more and more attention. Especially the technology of high-density environment has become an important research content, and the relevant methods for the existence of extremely dense crowd are not optimal. In this paper, we propose a multi-level attentive Convolutional Neural Network (MLAttnCNN) for crowd counting. We extract high-level contextual information with multiple different scales applied in pooling, and use multi-level attention modules to enrich the characteristics at different layers to achieve more efficient multi-scale feature fusion, which is able to be used to generate a more accurate density map with dilated convolutions and a 1×1 convolution. The extensive experiments on three available public datasets show that our proposed network achieves outperformance to the state-of-the-art approaches.
updated: Mon May 24 2021 17:29:00 GMT+0000 (UTC)
published: Mon May 24 2021 17:29:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト