ラベル付けは、群集画像内の各個人に注釈を付ける必要があるため、群集カウントにとって面倒です。最近、ラベリングの労力を減らすために、半教師あり群集カウントのためのいくつかの方法が提案されています。限られたラベリング予算を考えると、彼らは通常、いくつかの群衆の画像を選択し、それらのそれぞれのすべての個人に密にラベルを付けます。有望な結果にもかかわらず、各群集画像の密にラベル付けされた個体は通常類似しているように見えますが、ラベルのない大規模な群集画像には完全に多様な個体が含まれている可能性があるため、None-or-Allラベリング戦略は最適ではないと主張します。この目的のために、以前の方法のラベリングチェーンを断ち切り、半教師あり群集カウントの空間ラベリングの冗長性を減らす最初の試みを行うことを提案します。まず、各群集画像のすべての領域に注釈を付けるのではなく、代表的な領域のみに注釈を付けることを提案します。地域の代表性を垂直方向と水平方向の両方から分析し、それらをガウス混合モデルのクラスター中心として定式化します。さらに、豊富なラベルなし領域を活用するために、各群集画像内の個人間の類似性を利用して、以前の方法で採用されたエラーが発生しやすいラベル伝播の代わりに、特徴伝播を介してラベルなし領域を直接監視します。このようにして、個々の類似性によって引き起こされた元の空間ラベル付けの冗長性を、ラベル付けされていない領域の効果的な監視信号に転送できます。広く使用されているベンチマークでの広範な実験は、私たちの方法が以前の最良のアプローチを大幅に上回ることができることを示しています。
Labeling is onerous for crowd counting as it should annotate each individual in crowd images. Recently, several methods have been proposed for semi-supervised crowd counting to reduce the labeling efforts. Given a limited labeling budget, they typically select a few crowd images and densely label all individuals in each of them. Despite the promising results, we argue the None-or-All labeling strategy is suboptimal as the densely labeled individuals in each crowd image usually appear similar while the massive unlabeled crowd images may contain entirely diverse individuals. To this end, we propose to break the labeling chain of previous methods and make the first attempt to reduce spatial labeling redundancy for semi-supervised crowd counting. First, instead of annotating all the regions in each crowd image, we propose to annotate the representative ones only. We analyze the region representativeness from both vertical and horizontal directions, and formulate them as cluster centers of Gaussian Mixture Models. Additionally, to leverage the rich unlabeled regions, we exploit the similarities among individuals in each crowd image to directly supervise the unlabeled regions via feature propagation instead of the error-prone label propagation employed in the previous methods. In this way, we can transfer the original spatial labeling redundancy caused by individual similarities to effective supervision signals on the unlabeled regions. Extensive experiments on the widely-used benchmarks demonstrate that our method can outperform previous best approaches by a large margin.