群集のカウントは、閉塞、スケール、および密度の変動が大きいため、困難な作業です。既存の方法は、低解像度 (LR) の状況を無視しながら、これらの課題を効果的に処理します。 LR の状況は、次の 2 つの重大な理由により、計数のパフォーマンスを大幅に弱めます。1) 詳細情報が限られている。 2) 重複する頭部領域が密度マップに蓄積され、極端なグラウンド トゥルース値が得られます。直感的な解決策は、入力 LR 画像に超解像 (SR) 前処理を採用することです。ただし、推論手順が複雑になるため、リアルタイムが必要な場合のアプリケーションの可能性が制限されます。 Multi-Scale Super-Resolution Module (MSSRM) と呼ばれるより洗練された方法を提案します。失われた詳細を推定するようにネットワークを導き、特徴空間の詳細情報を強化します。 MSSRM がプラグイン プラグアウトであり、推論コストなしで LR 問題を処理することは注目に値します。提案された方法は SR ラベルを必要とするため、超解像度群衆カウント データセット (SR-Crowd) をさらに提案します。 3 つのデータセットに対する広範な実験により、この方法の優位性が実証されました。コードは https://github.com/PRIS-CV/MSSRM.git で入手できます。
Crowd counting is a challenging task due to the heavy occlusions, scales, and density variations. Existing methods handle these challenges effectively while ignoring low-resolution (LR) circumstances. The LR circumstances weaken the counting performance deeply for two crucial reasons: 1) limited detail information; 2) overlapping head regions accumulate in density maps and result in extreme ground-truth values. An intuitive solution is to employ super-resolution (SR) pre-processes for the input LR images. However, it complicates the inference steps and thus limits application potentials when requiring real-time. We propose a more elegant method termed Multi-Scale Super-Resolution Module (MSSRM). It guides the network to estimate the lost de tails and enhances the detailed information in the feature space. Noteworthy that the MSSRM is plug-in plug-out and deals with the LR problems with no inference cost. As the proposed method requires SR labels, we further propose a Super-Resolution Crowd Counting dataset (SR-Crowd). Extensive experiments on three datasets demonstrate the superiority of our method. The code will be available at https://github.com/PRIS-CV/MSSRM.git.