arXiv reaDer
クロスドメイン適応のためのラベル伝播による無人航空機のリアルタイム マルチモーダル セマンティック フュージョン
Real-Time Multi-Modal Semantic Fusion on Unmanned Aerial Vehicles with Label Propagation for Cross-Domain Adaptation
複数の補完的なセンサーを搭載した無人航空機 (UAV) は、自律型またはリモート制御型のセマンティック シーン分析 (災害調査など) に大きな可能性を秘めています。ここでは、リアルタイムのセマンティック推論と複数のセンサー モダリティの融合のための UAV システムを提案します。 LiDAR スキャンと RGB 画像のセマンティック セグメンテーション、および RGB と熱画像のオブジェクト検出は、軽量の CNN アーキテクチャと組み込みの推論アクセラレータを使用して、UAV コンピューター上でオンラインで実行されます。複数のセンサーモダリティからのセマンティック情報が3Dポイントクラウドと画像セグメンテーションマスクを増強すると同時に、アロセントリックセマンティックマップも生成する後期融合アプローチに従います。セマンティック マップ上でのラベルの伝播により、クロス モダリティおよびクロス ドメイン監視によるセンサー固有の適応が可能になります。私たちのシステムは、拡張セマンティック イメージとポイント クラウドを ≈ 9 Hz で提供します。都市環境および災害試験現場での実世界実験で統合システムを評価します。
Unmanned aerial vehicles (UAVs) equipped with multiple complementary sensors have tremendous potential for fast autonomous or remote-controlled semantic scene analysis, e.g., for disaster examination. Here, we propose a UAV system for real-time semantic inference and fusion of multiple sensor modalities. Semantic segmentation of LiDAR scans and RGB images, as well as object detection on RGB and thermal images, run online onboard the UAV computer using lightweight CNN architectures and embedded inference accelerators. We follow a late fusion approach where semantic information from multiple sensor modalities augments 3D point clouds and image segmentation masks while also generating an allocentric semantic map. Label propagation on the semantic map allows for sensor-specific adaptation with cross-modality and cross-domain supervision. Our system provides augmented semantic images and point clouds with ≈ 9 Hz. We evaluate the integrated system in real-world experiments in an urban environment and at a disaster test site.
updated: Tue Oct 18 2022 10:32:11 GMT+0000 (UTC)
published: Tue Oct 18 2022 10:32:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト