arXiv reaDer
LiDAR2Map: オンライン カメラ蒸留を使用した LiDAR ベースのセマンティック マップ構築の防御
LiDAR2Map: In Defense of LiDAR-Based Semantic Map Construction Using Online Camera Distillation
鳥瞰図 (BEV) の下でのセマンティック マップの構築は、自動運転において重要な役割を果たします。カメラ画像とは対照的に、LiDAR は正確な 3D 観測を提供し、キャプチャされた 3D フィーチャを本質的に BEV 空間に投影します。ただし、通常の LiDAR ベースの BEV 機能には多くの不確定なノイズが含まれていることが多く、空間機能にはテクスチャやセマンティック キューがほとんどありません。この論文では、セマンティック マップを構築するための効果的な LiDAR ベースの方法を提案します。具体的には、セマンティック マップ構築のための堅牢なマルチスケール BEV 機能を学習する BEV ピラミッド機能デコーダーを導入します。これにより、LiDAR ベースの方法の精度が大幅に向上します。 LiDAR データにセマンティック キューがないことによって引き起こされる欠陥を軽減するために、オンラインの Camera-to-LiDAR 蒸留スキームを提示して、画像からポイント クラウドへのセマンティック学習を容易にします。私たちの蒸留スキームは、機能レベルとロジットレベルの蒸留で構成され、BEV のカメラからセマンティック情報を吸収します。挑戦的な nuScenes データセットに関する実験結果は、セマンティック マップの構築に対する提案された LiDAR2Map の有効性を示しています。これは、27.9% mIoU を超える以前の LiDAR ベースの方法よりも大幅に優れており、最先端のカメラベースのアプローチよりも優れています。ソース コードは、https://github.com/songw-zju/LiDAR2Map で入手できます。
Semantic map construction under bird's-eye view (BEV) plays an essential role in autonomous driving. In contrast to camera image, LiDAR provides the accurate 3D observations to project the captured 3D features onto BEV space inherently. However, the vanilla LiDAR-based BEV feature often contains many indefinite noises, where the spatial features have little texture and semantic cues. In this paper, we propose an effective LiDAR-based method to build semantic map. Specifically, we introduce a BEV pyramid feature decoder that learns the robust multi-scale BEV features for semantic map construction, which greatly boosts the accuracy of the LiDAR-based method. To mitigate the defects caused by lacking semantic cues in LiDAR data, we present an online Camera-to-LiDAR distillation scheme to facilitate the semantic learning from image to point cloud. Our distillation scheme consists of feature-level and logit-level distillation to absorb the semantic information from camera in BEV. The experimental results on challenging nuScenes dataset demonstrate the efficacy of our proposed LiDAR2Map on semantic map construction, which significantly outperforms the previous LiDAR-based methods over 27.9% mIoU and even performs better than the state-of-the-art camera-based approaches. Source code is available at: https://github.com/songw-zju/LiDAR2Map.
updated: Sat Apr 22 2023 12:05:29 GMT+0000 (UTC)
published: Sat Apr 22 2023 12:05:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト