arXiv reaDer
ワンステージでアンカーフリーの物体検出において、最小限のコストで最小限のミスアライメントに向けて
Toward Minimal Misalignment at Minimal Cost in One-Stage and Anchor-Free Object Detection
一般的なオブジェクト検出モデルは、分類ブランチと回帰ブランチで構成されます。タスクドライバーが異なるため、これら2つのブランチは、同じスケールレベルと同じ空間位置からの特徴に対する感度が異なります。高い分類信頼点が高い回帰品質を持っているという仮定に基づく点ベースの予測方法は、ミスアラインメントの問題につながります。私たちの分析によると、問題はさらにスケールのずれと空間のずれで構成されています。最小限のコストでこの現象を解決することを目指しています。ヘッドネットワークの微調整と、リジッドなものに代わる新しいラベル割り当て方法です。私たちの実験は、ベースラインFCOS、1ステージでアンカーのないオブジェクト検出モデルと比較して、私たちのモデルは異なるバックボーンで一貫して約3 APの改善を達成し、私たちの方法の単純さと効率の両方を示しています。
Common object detection models consist of classification and regression branches, due to different task drivers, these two branches have different sensibility to the features from the same scale level and the same spatial location. The point-based prediction method, which is based on the assumption that the high classification confidence point has the high regression quality, leads to the misalignment problem. Our analysis shows, the problem is further composed of scale misalignment and spatial misalignment specifically. We aim to resolve the phenomenon at minimal cost: a minor adjustment of the head network and a new label assignment method replacing the rigid one. Our experiments show that, compared to the baseline FCOS, a one-stage and anchor-free object detection model, our model consistently get around 3 AP improvement with different backbones, demonstrating both simplicity and efficiency of our method.
updated: Wed Dec 22 2021 03:54:48 GMT+0000 (UTC)
published: Thu Dec 16 2021 14:22:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト