arXiv reaDer
オブジェクト検出のための分類とローカリゼーションの再考
Rethinking Classification and Localization for Object Detection
 R-CNNベースの検出器では、2つのヘッド構造(つまり、完全に接続されたヘッドとたたみ込みヘッド)が分類およびローカリゼーションタスクに広く使用されています。ただし、これら2つのヘッド構造がこれら2つのタスクでどのように機能するかについての理解が不足しています。この問題に対処するために、我々は徹底的な分析を行い、2つのヘッド構造が2つのタスクに対して反対の好みを持っているという興味深い事実を見つけます。具体的には、完全に接続されたヘッド(fc-head)が分類タスクにより適し、コンボリューションヘッド(conv-head)がローカリゼーションタスクにより適しています。さらに、両方のヘッドの出力フィーチャマップを調べて、fc-headがconv-headよりも空間感度が高いことを確認します。したがって、fc-headには、オブジェクト全体とオブジェクトの一部を区別する機能がありますが、オブジェクト全体を後退させるための堅牢性はありません。これらの調査結果に基づいて、分類に焦点を合わせた完全に接続されたヘッドと、バウンディングボックス回帰の畳み込みヘッドを持つDouble-Headメソッドを提案します。ベルとホイッスルなしで、私たちの方法は、ResNet-50およびResNet-101バックボーンを備えたFeature Pyramid Network(FPN)ベースラインからのMS COCOデータセットで+3.5および+2.8 APをそれぞれ獲得します。
Two head structures (i.e. fully connected head and convolution head) have been widely used in R-CNN based detectors for classification and localization tasks. However, there is a lack of understanding of how does these two head structures work for these two tasks. To address this issue, we perform a thorough analysis and find an interesting fact that the two head structures have opposite preferences towards the two tasks. Specifically, the fully connected head (fc-head) is more suitable for the classification task, while the convolution head (conv-head) is more suitable for the localization task. Furthermore, we examine the output feature maps of both heads and find that fc-head has more spatial sensitivity than conv-head. Thus, fc-head has more capability to distinguish a complete object from part of an object, but is not robust to regress the whole object. Based upon these findings, we propose a Double-Head method, which has a fully connected head focusing on classification and a convolution head for bounding box regression. Without bells and whistles, our method gains +3.5 and +2.8 AP on MS COCO dataset from Feature Pyramid Network (FPN) baselines with ResNet-50 and ResNet-101 backbones, respectively.
updated: Thu Apr 02 2020 21:11:47 GMT+0000 (UTC)
published: Sat Apr 13 2019 06:41:56 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト