深い畳み込みニューラルネットワークの開発により、頭部と人間の検出が急速に改善されました。ただし、これらの2つのタスクは、固有の相関を考慮せずに個別に研究されることが多く、1)頭部検出がより多くの誤検知に陥る場合が多く、2)人検知器のパフォーマンスが群衆シーンで劇的に低下することがよくありますこれらの2つの問題に対処するために、頭部と人体を同時に効果的に検出するJointDetという新しい共同頭部と人間の検出ネットワークを紹介します。さらに、頭と人体の間の関係学習を実行する頭と体の関係判別モジュールを設計し、この学習した関係を活用して、抑制された人間の検出を取り戻し、頭の誤検出を減らします。提案された方法の有効性を検証するために、CityPersonsおよびCaltech-USAデータセットの頭部境界ボックスに注釈を付け、CrowdHuman、CityPersonsおよびCaltech-USAデータセットで広範な実験を実施します。結果として、提案されたJointDet検出器は、これら3つのベンチマークで最先端の性能を達成します。頭部と人間の検出の問題に関するさらなる研究を促進するために、すべての新しい注釈、ソースコード、および訓練されたモデルが公開されます。
Head and human detection have been rapidly improved with the development of deep convolutional neural networks. However, these two tasks are often studied separately without considering their inherent correlation, leading to that 1) head detection is often trapped in more false positives, and 2) the performance of human detector frequently drops dramatically in crowd scenes. To handle these two issues, we present a novel joint head and human detection network, namely JointDet, which effectively detects head and human body simultaneously. Moreover, we design a head-body relationship discriminating module to perform relational learning between heads and human bodies, and leverage this learned relationship to regain the suppressed human detections and reduce head false positives. To verify the effectiveness of the proposed method, we annotate head bounding boxes of the CityPersons and Caltech-USA datasets, and conduct extensive experiments on the CrowdHuman, CityPersons and Caltech-USA datasets. As a consequence, the proposed JointDet detector achieves state-of-the-art performance on these three benchmarks. To facilitate further studies on the head and human detection problem, all new annotations, source codes and trained models will be public.