arXiv reaDer
歩行者検出のためのDETR
DETR for Pedestrian Detection
群集シーンでの歩行者の検出は、アンカーから歩行者へのヒューリスティックに定義されたマッピングと、NMSと高度にオーバーラップした歩行者の間の競合のために困難な問題を引き起こします。最近提案されたエンドツーエンド検出器(ED)、DETRおよび変形可能なDETRは、クエリ間のすべてのペアワイズ相互作用を計算することによって重複予測を取り除くトランスアーキテクチャを使用して、NMSやアンカーなどの手動で設計されたコンポーネントを置き換えます。これらの作品に触発されて、群衆の歩行者検出におけるそれらのパフォーマンスを調査します。驚いたことに、FPNを使用したFaster-RCNNと比較すると、結果はCOCOで得られた結果とは逆になります。さらに、EDの2部一致は、群集シーンでのグラウンドトゥルース数が多いため、トレーニング効率に悪影響を及ぼします。この作業では、EDのパフォーマンスの低下を引き起こしている根本的な動機を特定し、それらに対処するための新しいデコーダーを提案します。さらに、ED専用の歩行者の目立たない部分を活用するメカニズムを設計し、さらなる改善を実現します。群集データセットのEDトレーニングをより実用的にするために、より高速な2部一致アルゴリズムも導入されています。提案された検出器PED(歩行者エンドツーエンド検出器)は、CityPersonsとCrowdHumanの以前のEDとベースラインのFaster-RCNNの両方を上回っています。また、最先端の歩行者検出方法と同等のパフォーマンスを実現します。コードはまもなくリリースされます。
Pedestrian detection in crowd scenes poses a challenging problem due to the heuristic defined mapping from anchors to pedestrians and the conflict between NMS and highly overlapped pedestrians. The recently proposed end-to-end detectors(ED), DETR and deformable DETR, replace hand designed components such as NMS and anchors using the transformer architecture, which gets rid of duplicate predictions by computing all pairwise interactions between queries. Inspired by these works, we explore their performance on crowd pedestrian detection. Surprisingly, compared to Faster-RCNN with FPN, the results are opposite to those obtained on COCO. Furthermore, the bipartite match of ED harms the training efficiency due to the large ground truth number in crowd scenes. In this work, we identify the underlying motives driving ED's poor performance and propose a new decoder to address them. Moreover, we design a mechanism to leverage the less occluded visible parts of pedestrian specifically for ED, and achieve further improvements. A faster bipartite match algorithm is also introduced to make ED training on crowd dataset more practical. The proposed detector PED(Pedestrian End-to-end Detector) outperforms both previous EDs and the baseline Faster-RCNN on CityPersons and CrowdHuman. It also achieves comparable performance with state-of-the-art pedestrian detection methods. Code will be released soon.
updated: Sat Dec 12 2020 11:02:05 GMT+0000 (UTC)
published: Sat Dec 12 2020 11:02:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト