arXiv reaDer
ディープニューラルネットワークを使用した無人航空機の視覚的検出と追跡:パフォーマンスベンチマーク
Unmanned Aerial Vehicle Visual Detection and Tracking using Deep Neural Networks: A Performance Benchmark
無人航空機(UAV)は、過失と悪意のある使用の両方により、航空安全に大きなリスクをもたらす可能性があります。このため、UAVの自動検出と追跡は、空中セキュリティシステムの基本的なタスクです。 UAV検出の一般的な技術には、可視帯域および熱赤外線画像、無線周波数、レーダーが含まれます。画像ベースのオブジェクト検出のためのディープニューラルネットワーク(DNN)の最近の進歩により、この検出および追跡タスクに視覚情報を使用する可能性が開かれています。さらに、これらの検出アーキテクチャは、視覚追跡システムのバックボーンとして実装できるため、UAV侵入の永続的な追跡が可能になります。現在まで、UAVの検出と追跡のためにDNNを可視帯域画像に適用する包括的なパフォーマンスベンチマークは存在しません。この目的のために、UAVの検出と追跡のためのさまざまな環境条件を持つ3つのデータセット(合計241のビデオ(331,486の画像)を含む)が、4つの検出アーキテクチャと3つの追跡フレームワークを使用して評価されます。最高のパフォーマンスの検出器アーキテクチャは98.6%のmAPを取得し、最高のパフォーマンスの追跡フレームワークは96.3%のMOTAを取得します。クロスモダリティ評価は、可視スペクトルと赤外線スペクトルの間で実行され、赤外線モダリティでトレーニングすると、可視画像で最大82.8%のmAPを達成します。これらの結果は、最先端のディープラーニングベースの方法に対する最初のパブリックマルチアプローチベンチマークを提供し、UAVドメインでどの検出および追跡アーキテクチャが効果的であるかについての洞察を提供します。
Unmanned Aerial Vehicles (UAV) can pose a major risk for aviation safety, due to both negligent and malicious use. For this reason, the automated detection and tracking of UAV is a fundamental task in aerial security systems. Common technologies for UAV detection include visible-band and thermal infrared imaging, radio frequency and radar. Recent advances in deep neural networks (DNNs) for image-based object detection open the possibility to use visual information for this detection and tracking task. Furthermore, these detection architectures can be implemented as backbones for visual tracking systems, thereby enabling persistent tracking of UAV incursions. To date, no comprehensive performance benchmark exists that applies DNNs to visible-band imagery for UAV detection and tracking. To this end, three datasets with varied environmental conditions for UAV detection and tracking, comprising a total of 241 videos (331,486 images), are assessed using four detection architectures and three tracking frameworks. The best performing detector architecture obtains an mAP of 98.6% and the best performing tracking framework obtains a MOTA of 96.3%. Cross-modality evaluation is carried out between visible and infrared spectrums, achieving a maximal 82.8% mAP on visible images when training in the infrared modality. These results provide the first public multi-approach benchmark for state-of-the-art deep learning-based methods and give insight into which detection and tracking architectures are effective in the UAV domain.
updated: Thu Mar 25 2021 15:51:53 GMT+0000 (UTC)
published: Thu Mar 25 2021 15:51:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト