arXiv reaDer
Center and Scale Prediction: Anchor-free Approach for Pedestrian and Face Detection
オブジェクト検出には、一般に、従来のスライディングウィンドウ分類器、または最新の深層学習アプローチのアンカーボックスベースの予測が必要です。ただし、これらのアプローチのいずれも、ボックス内の面倒な構成を必要とします。この論文では、オブジェクトの検出が高レベルの意味的特徴検出タスクとして動機付けられるという新しい視点を提供します。エッジ、コーナー、ブロブ、その他の特徴検出器と同様に、提案された検出器は、畳み込みが自然に適している画像全体の特徴点をスキャンします。ただし、これらの従来の低レベルの機能とは異なり、提案された検出器は高レベルの抽象化を行います。つまり、オブジェクトが存在する中心点を探しており、最新のディープモデルはすでにそのような高レベルのセマンティック抽象化に対応しています。 。さらに、ブロブ検出と同様に、中心点のスケールも予測します。これも単純な畳み込みです。したがって、この論文では、歩行者と顔の検出は、畳み込みによる単純な中心とスケールの予測タスクとして簡略化されています。このように、提案された方法は、ボックスのない設定を楽しむ。構造的には単純ですが、歩行者検出や顔検出など、いくつかの難しいベンチマークで競争力のある精度を示します。さらに、クロスデータセット評価が実行され、提案された方法の優れた一般化能力が実証されます。コードとモデルには、(およびからアクセスできます。
Object detection generally requires sliding-window classifiers in tradition or anchor box based predictions in modern deep learning approaches. However, either of these approaches requires tedious configurations in boxes. In this paper, we provide a new perspective where detecting objects is motivated as a high-level semantic feature detection task. Like edges, corners, blobs and other feature detectors, the proposed detector scans for feature points all over the image, for which the convolution is naturally suited. However, unlike these traditional low-level features, the proposed detector goes for a higher-level abstraction, that is, we are looking for central points where there are objects, and modern deep models are already capable of such a high-level semantic abstraction. Besides, like blob detection, we also predict the scales of the central points, which is also a straightforward convolution. Therefore, in this paper, pedestrian and face detection is simplified as a straightforward center and scale prediction task through convolutions. This way, the proposed method enjoys a box-free setting. Though structurally simple, it presents competitive accuracy on several challenging benchmarks, including pedestrian detection and face detection. Furthermore, a cross-dataset evaluation is performed, demonstrating a superior generalization ability of the proposed method. Code and models can be accessed at ( and
updated: Sun Nov 07 2021 08:58:00 GMT+0000 (UTC)
published: Fri Apr 05 2019 09:14:57 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト