arXiv reaDer
群集ローカリゼーションのための独立したインスタンスマップの学習
Learning Independent Instance Maps for Crowd Localization
群集シーンで各頭の位置を正確に特定することは、群集分析の分野で重要なタスクです。ただし、従来の密度ベースの方法は粗い予測のみを予測し、セグメンテーション/検出ベースの方法では、非常に密度の高いシーンや広範囲のスケール変動の群集を処理できません。この目的のために、独立インスタンスマップセグメンテーション(IIM)と呼ばれる、群集のローカリゼーションのためのエンドツーエンドで直接的なフレームワークを提案します。密度マップやボックス回帰とは異なり、IIMの各インスタンスは重複していません。群集を独立した連結成分にセグメント化することにより、位置と群集数(それぞれ中心と構成要素の数)が取得されます。さらに、さまざまな密度領域のセグメンテーション品質を向上させるために、構造化インスタンスマップを出力するための微分可能な二値化モジュール(BM)を紹介します。 BMは、ローカリゼーションモデルに2つの利点をもたらします。1)各インスタンスをより正確に検出するために、さまざまな画像のしきい値マップを適応的に学習します。 2)バイナリ予測とラベルの損失を使用してモデルを直接トレーニングします。広範な実験により、提案された方法が効果的であり、5つの人気のある群集データセットの最先端の方法よりも優れていることが確認されます。重要なことに、IIMは、NWPU-Crowd LocalizationタスクでF1メジャーを10.4%改善します。ソースコードと事前トレーニング済みモデルは、https://github.com/taohan10200/IIMでリリースされます。
Accurately locating each head's position in the crowd scenes is a crucial task in the field of crowd analysis. However, traditional density-based methods only predict coarse prediction, and segmentation/detection-based methods cannot handle extremely dense scenes and large-range scale-variations crowds. To this end, we propose an end-to-end and straightforward framework for crowd localization, named Independent Instance Map segmentation (IIM). Different from density maps and boxes regression, each instance in IIM is non-overlapped. By segmenting crowds into independent connected components, the positions and the crowd counts (the centers and the number of components, respectively) are obtained. Furthermore, to improve the segmentation quality for different density regions, we present a differentiable Binarization Module (BM) to output structured instance maps. BM brings two advantages into localization models: 1) adaptively learn a threshold map for different images to detect each instance more accurately; 2) directly train the model using loss on binary predictions and labels. Extensive experiments verify the proposed method is effective and outperforms the-state-of-the-art methods on the five popular crowd datasets. Significantly, IIM improves F1-measure by 10.4% on the NWPU-Crowd Localization task. The source code and pre-trained models will be released at https://github.com/taohan10200/IIM.
updated: Mon Mar 22 2021 03:20:09 GMT+0000 (UTC)
published: Tue Dec 08 2020 02:17:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト