arXiv reaDer
空中画像での物体検出のためのキャリブレーションされたガイダンスの学習
Learning Calibrated-Guidance for Object Detection in Aerial Images
最近、航空画像での物体検出に関する研究は、コンピュータビジョンのコミュニティで大きな進歩を遂げました。ただし、ほとんどの最先端の方法は、チャネル内の特徴キャリブレーションの重要性を驚くほど無視しながら、計算の複雑さが高い時空間特徴キャリブレーションのための精巧な注意メカニズムを開発する傾向があります。この作業では、機能トランスフォーマー方式でチャネル通信を強化するためのシンプルで効果的なキャリブレーションガイダンス(CG)スキームを提案します。これにより、グローバル機能アフィニティペアに基づいて各チャネルのキャリブレーション重みを適応的に決定できます。具体的には、特徴マップのセットが与えられると、CGは最初に各チャネルと残りのチャネル間の特徴の類似性を中間キャリブレーションガイダンスとして計算します。次に、ガイダンスを介して重み付けされたすべてのチャネルを集約することにより、各チャネルを再表現します。私たちのCGは、CG-Netという名前のディープニューラルネットワークに接続できます。その有効性と効率を実証するために、航空画像の方向付けされたオブジェクト検出タスクと水平方向のオブジェクト検出タスクの両方で広範な実験が実行されます。 2つの挑戦的なベンチマーク(つまり、DOTAとHRSC2016)の結果は、当社のCG-Netがかなりの計算オーバーヘッドで最先端のパフォーマンスを正確に達成できることを示しています。 https://github.com/WeiZongqi/CG-Net
Recently, the study on object detection in aerial images has made tremendous progress in the community of computer vision. However, most state-of-the-art methods tend to develop elaborate attention mechanisms for the space-time feature calibrations with high computational complexity, while surprisingly ignoring the importance of feature calibrations in channels. In this work, we propose a simple yet effective Calibrated-Guidance (CG) scheme to enhance channel communications in a feature transformer fashion, which can adaptively determine the calibration weights for each channel based on the global feature affinity-pairs. Specifically, given a set of feature maps, CG first computes the feature similarity between each channel and the remaining channels as the intermediary calibration guidance. Then, re-representing each channel by aggregating all the channels weighted together via the guidance. Our CG can be plugged into any deep neural network, which is named as CG-Net. To demonstrate its effectiveness and efficiency, extensive experiments are carried out on both oriented and horizontal object detection tasks of aerial images. Results on two challenging benchmarks (i.e., DOTA and HRSC2016) demonstrate that our CG-Net can achieve state-of-the-art performance in accuracy with a fair computational overhead. https://github.com/WeiZongqi/CG-Net
updated: Sun Mar 21 2021 13:55:46 GMT+0000 (UTC)
published: Sun Mar 21 2021 13:55:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト