arXiv reaDer
調和した物体検出のためのローカリゼーションと分類の変調
Modulating Localization and Classification for Harmonized Object Detection
オブジェクト検出には、2つのサブタスクが含まれます。つまり、画像内のオブジェクトをローカライズし、それらをさまざまなカテゴリに分類します。既存のCNNベースの検出器では、ローカリゼーションと分類の間に広範な相違があり、パフォーマンスの低下につながることがわかります。この作業では、2つのタスクを調整するための相互学習フレームワークを提案します。特に、2つのタスクは、新しい相互ラベル付け戦略を使用して相互に学習することを余儀なくされています。さらに、シンプルでありながら効果的なIoU再スコアリングスキームを導入します。これにより、発散がさらに減少します。さらに、スピアマンの順位相関ベースのメトリックを定義して、発散を定量化します。これは、検出パフォーマンスとよく相関します。提案されたアプローチは汎用であり、FCOSやRetinaNetなどの既存の検出器に簡単に注入できます。 COCOデータセットのベースライン検出器よりも大幅なパフォーマンスの向上を実現しています。
Object detection involves two sub-tasks, i.e. localizing objects in an image and classifying them into various categories. For existing CNN-based detectors, we notice the widespread divergence between localization and classification, which leads to degradation in performance. In this work, we propose a mutual learning framework to modulate the two tasks. In particular, the two tasks are forced to learn from each other with a novel mutual labeling strategy. Besides, we introduce a simple yet effective IoU rescoring scheme, which further reduces the divergence. Moreover, we define a Spearman rank correlation-based metric to quantify the divergence, which correlates well with the detection performance. The proposed approach is general-purpose and can be easily injected into existing detectors such as FCOS and RetinaNet. We achieve a significant performance gain over the baseline detectors on the COCO dataset.
updated: Thu Mar 25 2021 07:53:10 GMT+0000 (UTC)
published: Tue Mar 16 2021 10:36:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト