arXiv reaDer
群集計数のためのプログレッシブ マルチ解像度損失
Progressive Multi-resolution Loss for Crowd Counting
群集のカウントは通常、密度マップ回帰方式で処理されます。これは、予測された密度マップとグラウンド トゥルースの間の L2 損失によって監視されます。モデルを効果的に調整するために、予測密度と注釈位置の間のより良い対応を見つけるために、さまざまな改善された L2 損失関数が提案されています。この論文では、密度マップを 1 つの解像度で予測し、密度マップを複数の解像度で測定することを提案します。このような設定で事後確率を最大化することにより、従来の単一解像度 L2 損失がその特定のケースである、対数形式の多重解像度 L2 差損失が得られます。単一解像度の L2 損失よりも優れていることを数学的に証明します。付属品がなければ、提案された損失はいくつかのベースラインを大幅に改善し、4 つの群衆カウント データセット、ShanghaiTech A & B、UCF-QNRF、および JHU-Crowd++ での最先端の方法と比較して良好に機能します。
Crowd counting is usually handled in a density map regression fashion, which is supervised via a L2 loss between the predicted density map and ground truth. To effectively regulate models, various improved L2 loss functions have been proposed to find a better correspondence between predicted density and annotation positions. In this paper, we propose to predict the density map at one resolution but measure the density map at multiple resolutions. By maximizing the posterior probability in such a setting, we obtain a log-formed multi-resolution L2-difference loss, where the traditional single-resolution L2 loss is its particular case. We mathematically prove it is superior to a single-resolution L2 loss. Without bells and whistles, the proposed loss substantially improves several baselines and performs favorably compared to state-of-the-art methods on four crowd counting datasets, ShanghaiTech A & B, UCF-QNRF, and JHU-Crowd++.
updated: Thu Dec 08 2022 07:55:13 GMT+0000 (UTC)
published: Thu Dec 08 2022 07:55:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト