高空飛行のドローンによってキャプチャされたビジュアルは、世界中の生物多様性と動物個体群動態を評価するためにますます使用されています。それでも、超高解像度カメラにもかかわらず、挑戦的な取得シナリオと空中画像での小動物の描写は、これまでのところ、コンピュータービジョン検出器を高い信頼性でうまく適用するための制限要因でした。この論文では、深部物体検出器を超解像技術および高度データと組み合わせることにより、この問題に初めて対処します。特に、ホリスティックアテンションネットワークベースの超解像アプローチとカスタムビルドの高度データ活用ネットワークを標準の認識パイプラインに統合することで、実際の設定での検出効率を大幅に向上できることを示します。 2つの公開された、大規模な空中捕獲動物データセット、SAVMAPとAEDでシステムを評価します。提案されたアプローチは、両方のデータセットのアブレーションされたベースラインと最先端のパフォーマンスを一貫して改善できることがわかりました。さらに、動物の解像度と検出性能の関係の体系的な分析を提供します。超解像および高度知識の活用手法は、設定全体でベンチマークを大幅に増加させる可能性があるため、航空写真で微細に解像された動物を検出する場合は日常的に使用する必要があると結論付けています。
Visuals captured by high-flying aerial drones are increasingly used to assess biodiversity and animal population dynamics around the globe. Yet, challenging acquisition scenarios and tiny animal depictions in airborne imagery, despite ultra-high resolution cameras, have so far been limiting factors for applying computer vision detectors successfully with high confidence. In this paper, we address the problem for the first time by combining deep object detectors with super-resolution techniques and altitude data. In particular, we show that the integration of a holistic attention network based super-resolution approach and a custom-built altitude data exploitation network into standard recognition pipelines can considerably increase the detection efficacy in real-world settings. We evaluate the system on two public, large aerial-capture animal datasets, SAVMAP and AED. We find that the proposed approach can consistently improve over ablated baselines and the state-of-the-art performance for both datasets. In addition, we provide a systematic analysis of the relationship between animal resolution and detection performance. We conclude that super-resolution and altitude knowledge exploitation techniques can significantly increase benchmarks across settings and, thus, should be used routinely when detecting minutely resolved animals in aerial imagery.