arXiv reaDer
UAV-ReID:ビデオ画像における無人航空機の再識別に関するベンチマーク
UAV-ReID: A Benchmark on Unmanned Aerial Vehicle Re-identification in Video Imagery
無人航空機(UAV)がアプリケーションの範囲の拡大に伴ってアクセスしやすくなるにつれて、UAVの混乱の潜在的なリスクが高まります。ディープラーニングの最近の開発により、ビジョンベースのカウンターUAVシステムが単一のカメラでUAVを検出および追跡できるようになりました。ただし、単一のカメラのカバレッジは制限されているため、カメラ間でUAVを一致させるためにマルチカメラ構成が必要になります。これは再識別(reID)と呼ばれる問題です。時間と視点を超えてオブジェクトを照合するための人と車両のreIDに関する広範な研究が行われていますが、私たちの知る限り、UAVreIDに関する研究はありません。 UAVは再識別が困難です。歩行者や車両よりもはるかに小さく、空中で検出されることが多いため、より広い範囲の角度で表示されます。現在、複数のカメラを使用するUAVデータセットはないため、この新しい分野での機械学習ソリューションの開発を容易にする最初の新しいUAV再識別データセットUAV-reIDを提案します。 UAV-reIDには2つの設定があります。Temporally-Nearはビュー全体のパフォーマンスを評価してフレームワークの追跡を支援し、Big-to-Smallはスケール全体のreIDパフォーマンスを評価し、UAVが長距離から検出されたときに早期のreIDを可能にします。さまざまなreIDバックボーンと損失関数を広範囲に評価することにより、ベンチマーク調査を実施します。適切な設定により、ディープネットワークはUAVの適切な表現を学習するのに十分強力であり、Temporally-Near設定で81.9%、挑戦的なBig-to-Small設定で46.5%を達成することを示します。さらに、ビジョントランスフォーマーは、スケールの極端な変動に対して最も堅牢であることがわかります。
As unmanned aerial vehicles (UAVs) become more accessible with a growing range of applications, the potential risk of UAV disruption increases. Recent development in deep learning allows vision-based counter-UAV systems to detect and track UAVs with a single camera. However, the coverage of a single camera is limited, necessitating the need for multicamera configurations to match UAVs across cameras - a problem known as re-identification (reID). While there has been extensive research on person and vehicle reID to match objects across time and viewpoints, to the best of our knowledge, there has been no research in UAV reID. UAVs are challenging to re-identify: they are much smaller than pedestrians and vehicles and they are often detected in the air so appear at a greater range of angles. Because no UAV data sets currently use multiple cameras, we propose the first new UAV re-identification data set, UAV-reID, that facilitates the development of machine learning solutions in this emerging area. UAV-reID has two settings: Temporally-Near to evaluate performance across views to assist tracking frameworks, and Big-to-Small to evaluate reID performance across scale and to allow early reID when UAVs are detected from a long distance. We conduct a benchmark study by extensively evaluating different reID backbones and loss functions. We demonstrate that with the right setup, deep networks are powerful enough to learn good representations for UAVs, achieving 81.9% mAP on the Temporally-Near setting and 46.5% on the challenging Big-to-Small setting. Furthermore, we find that vision transformers are the most robust to extreme variance of scale.
updated: Thu Dec 02 2021 13:42:01 GMT+0000 (UTC)
published: Tue Apr 13 2021 14:13:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト