Multi-View Fusion of Sensor Data for Improved Perception and Prediction in Autonomous Driving
LiDARリターンとカメラ画像のマルチビュー表現を利用したオブジェクト検出と軌道予測のエンドツーエンドの方法を紹介します。この作業では、さまざまなビュー表現の長所と短所を認識し、すべてのビューからの利点を集約する効率的で一般的な融合方法を提案します。私たちのモデルは、一連の履歴LiDARデータからのボクセル化された特徴とラスター化された高解像度マップを融合して検出および予測タスクを実行する最先端の鳥瞰図(BEV)ネットワーク上に構築されています。このモデルを、ネイティブの非量子化表現で生のLiDAR情報を使用する追加のLiDAR Range-View(RV)機能で拡張します。 RV特徴マップはBEVに投影され、LiDARおよび高解像度マップから計算されたBEV特徴と融合されます。次に、融合された特徴は、単一のエンドツーエンドのトレーニング可能なネットワーク内で、最終的な検出と軌道を出力するためにさらに処理されます。さらに、LiDARとカメラのRV融合は、このフレームワークを使用して、簡単で計算効率の高い方法で実行されます。提案されたマルチビューフュージョンアプローチは、自動運転車のフリートによって収集された独自の大規模な実世界データ、および計算量の増加を最小限に抑えた公共のnuScenesデータセットに関する最先端技術を向上させます。費用。
We present an end-to-end method for object detection and trajectory prediction utilizing multi-view representations of LiDAR returns and camera images. In this work, we recognize the strengths and weaknesses of different view representations, and we propose an efficient and generic fusing method that aggregates benefits from all views. Our model builds on a state-of-the-art Bird's-Eye View (BEV) network that fuses voxelized features from a sequence of historical LiDAR data as well as rasterized high-definition map to perform detection and prediction tasks. We extend this model with additional LiDAR Range-View (RV) features that use the raw LiDAR information in its native, non-quantized representation. The RV feature map is projected into BEV and fused with the BEV features computed from LiDAR and high-definition map. The fused features are then further processed to output the final detections and trajectories, within a single end-to-end trainable network. In addition, the RV fusion of LiDAR and camera is performed in a straightforward and computationally efficient manner using this framework. The proposed multi-view fusion approach improves the state-of-the-art on proprietary large-scale real-world data collected by a fleet of self-driving vehicles, as well as on the public nuScenes data set with minimal increases on the computational cost.
updated: Tue Oct 19 2021 00:36:07 GMT+0000 (UTC)
published: Thu Aug 27 2020 03:32:25 GMT+0000 (UTC)
