arXiv reaDer
一段階の物体検出における整列および不整列の特徴の再考
Rethinking the Aligned and Misaligned Features in One-stage Object Detection
1ステージのオブジェクト検出器は、ポイント機能を使用して検出結果を予測します。ただし、ポイントフィーチャにはオブジェクト全体の情報が不足していることが多く、そのため、オブジェクトとポイントフィーチャの位置がずれます。一方、分類タスクと回帰タスクはさまざまなオブジェクト領域に敏感ですが、それらの機能は空間的に調整されています。これら2つの問題は両方とも、検出パフォーマンスを妨げます。これらの2つの問題を解決するために、完全な畳み込み方式を壊すことなく、タスクごとにそれぞれ整列および解きほぐされた特徴を生成できる単純なプラグイン演算子を提案します。提案されたオペレーターは、各敏感な領域にある2つのタスク認識ポイントセットを予測することにより、ポイントフィーチャをオブジェクトに位置合わせし、2つのタスクを空間次元から解きほぐすことができます。また、分類と回帰のための長距離スキップ接続の反対の効果の興味深い発見を明らかにします。 Object-Aligned and Task-disentangled演算子(OAT)に基づいて、正確な検出結果を得るためにポイントセット機能を明示的に活用するOAT-Netを提案します。 MS-COCOデータセットでの広範な実験は、OATがさまざまな最先端の1ステージ検出器を約2APまで一貫してブーストできることを示しています。特に、Res2Net-101-DCNバックボーンを備えたOAT-Netは、COCOtest-devで53.7APを達成します。
One-stage object detectors rely on a point feature to predict the detection results. However, the point feature often lacks the information of the whole object, thereby leading to a misalignment between the object and the point feature. Meanwhile, the classification and regression tasks are sensitive to different object regions, but their features are spatially aligned. Both of these two problems hinder the detection performance. In order to solve these two problems, we propose a simple and plug-in operator that can generate aligned and disentangled features for each task, respectively, without breaking the fully convolutional manner. By predicting two task-aware point sets that are located in each sensitive region, the proposed operator can align the point feature with the object and disentangle the two tasks from the spatial dimension. We also reveal an interesting finding of the opposite effect of the long-range skip connection for classification and regression. On the basis of the Object-Aligned and Task-disentangled operator (OAT), we propose OAT-Net, which explicitly exploits point-set features for accurate detection results. Extensive experiments on the MS-COCO dataset show that OAT can consistently boost different state-of-the-art one-stage detectors by ∼2 AP. Notably, OAT-Net with Res2Net-101-DCN backbone achieves 53.7 AP on the COCO test-dev.
updated: Wed Sep 08 2021 08:43:39 GMT+0000 (UTC)
published: Fri Aug 27 2021 08:40:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト