無人航空機(UAV)によってキャプチャされた画像からの物体検出はますます有用になっています。地上から地上への画像でトレーニングされた一般的な物体検出方法の大成功にもかかわらず、UAVによってキャプチャされた画像に直接適用すると、パフォーマンスが大幅に低下します。不十分なパフォーマンスは、飛行高度の変化、悪天候、動的に変化する視野角など、UAV固有の多くの厄介な問題によるものです。これらの厄介な問題は、検出モデルが堅牢であり続ける必要がある多数のきめ細かいドメインを構成します。 。幸い、UAVは、UAV画像と一緒に無料で入手できるか、簡単に取得できる、さまざまな属性を表すメタデータを記録します。これらの無料のメタデータを関連するUAV画像と組み合わせて利用し、UAV画像内のオブジェクト検出の特定の困難な問題に対して、Nuisance Disentangled Feature Transform(NDFT)と呼ばれる敵対的なトレーニングフレームワークを介してドメインロバストな機能を学習することを提案します。これらの迷惑行為に対する堅牢性が向上します。 2つの既存のUAVベースのオブジェクト検出ベンチマークで最先端のパフォーマンス(単一モデル)を示すことにより、提案されたアルゴリズムの有効性を示します。コードはhttps://github.com/TAMU-VITA/UAV-NDFTで入手できます。
Object detection from images captured by Unmanned Aerial Vehicles (UAVs) is becoming increasingly useful. Despite the great success of the generic object detection methods trained on ground-to-ground images, a huge performance drop is observed when they are directly applied to images captured by UAVs. The unsatisfactory performance is owing to many UAV-specific nuisances, such as varying flying altitudes, adverse weather conditions, dynamically changing viewing angles, etc. Those nuisances constitute a large number of fine-grained domains, across which the detection model has to stay robust. Fortunately, UAVs will record meta-data that depict those varying attributes, which are either freely available along with the UAV images, or can be easily obtained. We propose to utilize those free meta-data in conjunction with associated UAV images to learn domain-robust features via an adversarial training framework dubbed Nuisance Disentangled Feature Transform (NDFT), for the specific challenging problem of object detection in UAV images, achieving a substantial gain in robustness to those nuisances. We demonstrate the effectiveness of our proposed algorithm, by showing state-of-the-art performance (single model) on two existing UAV-based object detection benchmarks. The code is available at https://github.com/TAMU-VITA/UAV-NDFT.