arXiv reaDer
不完全なラベルを使用した群衆密度の推定
Crowd Density Estimation using Imperfect Labels
密度推定は、群衆カウントで最も広く使用されている方法の 1 つであり、ディープ ラーニング モデルが頭部アノテーション付きの群衆画像から学習して、目に見えない画像の群衆密度を推定します。通常、モデルの学習パフォーマンスは注釈の精度に大きく影響され、注釈が不正確であると、予測中にローカリゼーションとカウント エラーが発生する可能性があります。完全にラベル付けされたデータセットを使用した群衆カウントに関するかなりの量の研究が存在しますが、モデルの精度に対する注釈エラーの影響を調査したものはありません。このホワイト ペーパーでは、不完全なラベル (ノイズの多いラベルと欠落したラベルの両方) がクラウド カウントの精度に与える影響を調査します。ディープ ラーニング モデル (アノテーターと呼ばれる) を使用して不完全なラベルを自動的に生成するシステムを提案します。これを使用して、新しい群衆カウント モデル (ターゲット モデル) をトレーニングします。 2 つの群衆計数モデルと 2 つのベンチマーク データセットに関する分析では、提案されたスキームが、注釈エラーに対する群衆モデルの堅牢性を示す完全なラベルでトレーニングされたモデルの精度に近い精度を達成することが示されています。
Density estimation is one of the most widely used methods for crowd counting in which a deep learning model learns from head-annotated crowd images to estimate crowd density in unseen images. Typically, the learning performance of the model is highly impacted by the accuracy of the annotations and inaccurate annotations may lead to localization and counting errors during prediction. A significant amount of works exist on crowd counting using perfectly labelled datasets but none of these explore the impact of annotation errors on the model accuracy. In this paper, we investigate the impact of imperfect labels (both noisy and missing labels) on crowd counting accuracy. We propose a system that automatically generates imperfect labels using a deep learning model (called annotator) which are then used to train a new crowd counting model (target model). Our analysis on two crowd counting models and two benchmark datasets shows that the proposed scheme achieves accuracy closer to that of the model trained with perfect labels showing the robustness of crowd models to annotation errors.
updated: Mon Jul 17 2023 09:09:14 GMT+0000 (UTC)
published: Fri Dec 02 2022 21:21:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト