この作業では、UAV鳥瞰図画像に適用可能なオブジェクト検出の新しい前処理ステップを紹介します。これをAdaptiveResizingと呼びます。設計上、UAVデータセットに固有のオブジェクトのスケールの大幅な変動に伴う課題を軽減するのに役立ちます。さらに、推論速度が平均2〜3倍向上します。これをUAVDT、VisDroneで広範囲にテストし、自分でキャプチャした新しいデータセットでテストし、かなり高速でありながら一貫した改善を実現します。さらに、このメソッドを一般的なUAVオブジェクト検出タスクに適用する方法を示します。さらに、ある高度の間隔でトレーニングし、別の高度の間隔でテストする高さ転送タスクでのアプローチのテストに成功しました。さらに、組み込みGPUへのデプロイを目的とした小型で高速な検出器を紹介します。コードは、当社のWebサイトで公開されます。
This work introduces a new preprocessing step for object detection applicable to UAV bird's eye view imagery, which we call Adaptive Resizing. By design, it helps alleviate the challenges coming with the vast variances in objects' scales, naturally inherent to UAV data sets. Furthermore, it improves inference speed by two to three times on average. We test this extensively on UAVDT, VisDrone, and on a new data set we captured ourselves and achieve consistent improvements while being considerably faster. Moreover, we show how to apply this method to generic UAV object detection tasks. Additionally, we successfully test our approach on a height transfer task where we train on some interval of altitudes and test on a different one. Furthermore, we introduce a small, fast detector meant for deployment to an embedded GPU. Code will be made publicly available on our website.