arXiv reaDer
低高度都市環境におけるビジョンベースの UAV 自己位置測定
Vision-Based UAV Self-Positioning in Low-Altitude Urban Environments
無人航空機 (UAV) は、安定した測位のために衛星システムに依存しています。ただし、衛星の受信可能範囲が限られていることや通信の中断により、UAV は衛星ベースの測位システムからの信号を失う可能性があります。このような状況では、ビジョンベースの技術が代替手段として機能し、UAV の自己位置決め機能を確保できます。ただし、既存のデータセットのほとんどは、UAV の自己測位タスクではなく、UAV によって識別されるオブジェクトの地理位置特定タスク用に開発されています。さらに、現在の UAV データセットは、Google マップなどの合成データに対して離散サンプリングを使用しているため、高密度サンプリングの重要な側面や現実世界のシナリオで一般的に経験される不確実性が無視されています。これらの問題に対処するために、この論文では、UAV 自己測位タスク用に設計された初の公的に利用可能なデータセットである新しいデータセット DenseUAV を紹介します。 DenseUAV は、都市部の低空で取得された UAV 画像に高密度サンプリングを採用します。合計 27,000 を超える 14 大学キャンパスの UAV ビュー画像と衛星ビュー画像が収集され、注釈が付けられ、新しいベンチマークが確立されました。モデル開発に関しては、まずこのタスクにおいて CNN に対する Transformer の優位性を検証します。次に、モデルの識別能力を強化し、モダリティの不一致を減らすために、計量学習を表現学習に組み込みます。さらに、両方の観点からの共同学習を促進するために、相互教師あり学習アプローチを提案します。最後に、Recall@K メトリクスを強化し、新しい測定値 SDM@K を導入して、検索と位置特定の両方の観点からトレーニングされたモデルのパフォーマンスを同時に評価します。その結果、提案されたベースライン方法は、DenseUAV 上で 83.05% という驚くべき Recall@1 スコアと 86.24% の SDM@1 スコアを達成しました。データセットとコードは https://github.com/Dmmm1997/DenseUAV で公開されます。
Unmanned Aerial Vehicles (UAVs) rely on satellite systems for stable positioning. However, due to limited satellite coverage or communication disruptions, UAVs may lose signals from satellite-based positioning systems. In such situations, vision-based techniques can serve as an alternative, ensuring the self-positioning capability of UAVs. However, most of the existing datasets are developed for the geo-localization tasks of the objects identified by UAVs, rather than the self-positioning task of UAVs. Furthermore, the current UAV datasets use discrete sampling on synthetic data, such as Google Maps, thereby neglecting the crucial aspects of dense sampling and the uncertainties commonly experienced in real-world scenarios. To address these issues, this paper presents a new dataset, DenseUAV, which is the first publicly available dataset designed for the UAV self-positioning task. DenseUAV adopts dense sampling on UAV images obtained in low-altitude urban settings. In total, over 27K UAV-view and satellite-view images of 14 university campuses are collected and annotated, establishing a new benchmark. In terms of model development, we first verify the superiority of Transformers over CNNs in this task. Then, we incorporate metric learning into representation learning to enhance the discriminative capacity of the model and to lessen the modality discrepancy. Besides, to facilitate joint learning from both perspectives, we propose a mutually supervised learning approach. Last, we enhance the Recall@K metric and introduce a new measurement, SDM@K, to evaluate the performance of a trained model from both the retrieval and localization perspectives simultaneously. As a result, the proposed baseline method achieves a remarkable Recall@1 score of 83.05% and an SDM@1 score of 86.24% on DenseUAV. The dataset and code will be made publicly available on https://github.com/Dmmm1997/DenseUAV.
updated: Thu Aug 10 2023 18:34:17 GMT+0000 (UTC)
published: Sun Jan 23 2022 07:18:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト