arXiv reaDer
群衆の位置特定のための焦点逆距離変換マップ
Focal Inverse Distance Transform Maps for Crowd Localization
このホワイト ペーパーでは、群集分析の重要なトピックである群集位置特定タスクに焦点を当てます。ほとんどの回帰ベースの方法は、畳み込みニューラル ネットワーク (CNN) を使用して密度マップを回帰します。これは、2 つの重大な理由により、非常に密集したシーンでインスタンスを正確に見つけることができません。1) 密度マップは一連のぼやけたガウス ブロブで構成されます。 、2) 密度マップの密な領域に重度のオーバーラップが存在します。この問題に取り組むために、群衆のローカリゼーション タスクのための新しい焦点逆距離変換 (FIDT) マップを提案します。密度マップと比較して、FIDT マップは、密集した領域で重なり合うことなく、人の位置を正確に表しています。 FIDT マップに基づいて、局所最大値検出戦略 (LMDS) が導出され、各個人の中心点が効果的に抽出されます。さらに、独立した SSIM (I-SSIM) 損失を導入して、モデルが局所的な構造情報を学習しやすくし、局所的な最大値をより適切に認識できるようにします。広範な実験により、提案された方法が 6 つの群衆データセットと 1 つの車両データセットで最先端のローカリゼーション パフォーマンスを報告することが実証されています。さらに、提案された方法は、ネガティブで非常に密集したシーンで優れたロバスト性を示すことがわかり、FIDT マップの有効性がさらに検証されます。コードとモデルは https://github.com/dk-liang/FIDTM で入手できます。
In this paper, we focus on the crowd localization task, a crucial topic of crowd analysis. Most regression-based methods utilize convolution neural networks (CNN) to regress a density map, which can not accurately locate the instance in the extremely dense scene, attributed to two crucial reasons: 1) the density map consists of a series of blurry Gaussian blobs, 2) severe overlaps exist in the dense region of the density map. To tackle this issue, we propose a novel Focal Inverse Distance Transform (FIDT) map for the crowd localization task. Compared with the density maps, the FIDT maps accurately describe the persons' locations without overlapping in dense regions. Based on the FIDT maps, a Local-Maxima-Detection-Strategy (LMDS) is derived to effectively extract the center point for each individual. Furthermore, we introduce an Independent SSIM (I-SSIM) loss to make the model tend to learn the local structural information, better recognizing local maxima. Extensive experiments demonstrate that the proposed method reports state-of-the-art localization performance on six crowd datasets and one vehicle dataset. Additionally, we find that the proposed method shows superior robustness on the negative and extremely dense scenes, which further verifies the effectiveness of the FIDT maps. The code and model will be available at https://github.com/dk-liang/FIDTM.
updated: Sun Sep 04 2022 03:45:09 GMT+0000 (UTC)
published: Tue Feb 16 2021 02:25:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト