Guided Attention Network for Object Detection and Counting on Drones
  オブジェクトの検出とカウントは関連していますが、特に小さなオブジェクトと乱雑な背景を持つドローンベースのシーンでは、難しい問題です。この論文では、特徴ピラミッドに基づいてオブジェクト検出タスクとカウントタスクの両方を処理する新しいガイド付き注意ネットワーク(GANet)を提案します。教師なしアテンションモジュールに依存する以前の方法とは異なり、背景とオブジェクトの間に提案された弱教師付きバックグラウンドアテンション(BA)を使用して、より意味的な特徴表現を実現することにより、異なるスケールの特徴マップを融合します。次に、オブジェクトのグローバルな外観とローカルな外観の両方を考慮して正確なローカリゼーションを促進するために、Foreground Attention(FA)モジュールが開発されました。さらに、新しいデータ引数戦略は、さまざまな複雑なシーンで堅牢なモデルをトレーニングするように設計されています。 3つの困難なベンチマーク(つまり、UAVDT、CARPK、およびPUCPR +)での広範な実験により、提案された方法の既存の方法と比較した最先端の検出およびカウント性能が示されています。
Object detection and counting are related but challenging problems, especially for drone based scenes with small objects and cluttered background. In this paper, we propose a new Guided Attention Network (GANet) to deal with both object detection and counting tasks based on the feature pyramid. Different from the previous methods relying on unsupervised attention modules, we fuse different scales of feature maps by using the proposed weakly-supervised Background Attention (BA) between the background and objects for more semantic feature representation. Then, the Foreground Attention (FA) module is developed to consider both global and local appearance of the object to facilitate accurate localization. Moreover, the new data argumentation strategy is designed to train a robust model in various complex scenes. Extensive experiments on three challenging benchmarks (i.e., UAVDT, CARPK and PUCPR+) show the state-of-the-art detection and counting performance of the proposed method compared with existing methods.
