arXiv reaDer
高密度物体検出におけるミスアライメント問題の再考
Rethinking the Misalignment Problem in Dense Object Detection
オブジェクト検出は、特定の画像内のオブジェクトをローカライズおよび分類することを目的としており、これら2つのタスクは異なるオブジェクト領域に敏感です。したがって、一部の場所では高品質のバウンディングボックスが予測されますが、分類スコアは低くなります。また、一部の場所ではまったく逆になります。 2つのタスクの間に不整合が存在し、それらの機能は空間的に絡み合っています。ミスアラインメントの問題を解決するために、プラグインのSpatial-disentangled and Task-aligned Operator(SALT)を提案します。各タスクのセンシティブな領域にある2つのタスク認識ポイントセットを予測することにより、SALTはそれらの領域からフィーチャを再割り当てし、対応するアンカーポイントに位置合わせできます。したがって、2つのタスクの機能は、空間的に整列され、解きほぐされます。 2つの回帰段階の違いを最小限に抑えるために、洗練された回帰結果から粗い回帰結果に知識を転送できる自己蒸留回帰(SDR)損失を提案します。 SALTとSDRの損失に基づいて、タスクに合わせたポイントセット機能を明示的に活用して正確な検出結果を得るSALT-Netを提案します。 MS-COCOデータセットでの広範な実験は、提案された方法が一貫してさまざまな最先端の高密度検出器を約2APブーストできることを示しています。特に、Res2Net-101-DCNバックボーンを備えたSALT-Netは、MS-COCOtest-devで53.8APを達成します。
Object detection aims to localize and classify the objects in a given image, and these two tasks are sensitive to different object regions. Therefore, some locations predict high-quality bounding boxes but low classification scores, and some locations are quite the opposite. A misalignment exists between the two tasks, and their features are spatially entangled. In order to solve the misalignment problem, we propose a plug-in Spatial-disentangled and Task-aligned operator (SALT). By predicting two task-aware point sets that are located in each task's sensitive regions, SALT can reassign features from those regions and align them to the corresponding anchor point. Therefore, features for the two tasks are spatially aligned and disentangled. To minimize the difference between the two regression stages, we propose a Self-distillation regression (SDR) loss that can transfer knowledge from the refined regression results to the coarse regression results. On the basis of SALT and SDR loss, we propose SALT-Net, which explicitly exploits task-aligned point-set features for accurate detection results. Extensive experiments on the MS-COCO dataset show that our proposed methods can consistently boost different state-of-the-art dense detectors by ∼2 AP. Notably, SALT-Net with Res2Net-101-DCN backbone achieves 53.8 AP on the MS-COCO test-dev.
updated: Mon Apr 11 2022 10:16:55 GMT+0000 (UTC)
published: Fri Aug 27 2021 08:40:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト