このホワイトペーパーでは、高解像度(HD)マップが、最新の3Dオブジェクト検出器のパフォーマンスと堅牢性を高めることができる強力な事前情報を提供することを示します。この目標に向けて、HDマップから幾何学的および意味的特徴を抽出する単一ステージ検出器を設計します。地図はどこでも利用できるとは限らないため、生のLiDARデータからその場で地図を推定する地図予測モジュールも提案します。 KITTIと100万フレームを含む大規模な3D検出ベンチマークで広範な実験を行い、提案されたマップ認識検出器が、マップされたシナリオとマップされていないシナリオの両方で常に最先端を上回っていることを示します。重要なのは、フレームワーク全体が毎秒20フレームで実行されることです。
In this paper we show that High-Definition (HD) maps provide strong priors that can boost the performance and robustness of modern 3D object detectors. Towards this goal, we design a single stage detector that extracts geometric and semantic features from the HD maps. As maps might not be available everywhere, we also propose a map prediction module that estimates the map on the fly from raw LiDAR data. We conduct extensive experiments on KITTI as well as a large-scale 3D detection benchmark containing 1 million frames, and show that the proposed map-aware detector consistently outperforms the state-of-the-art in both mapped and un-mapped scenarios. Importantly the whole framework runs at 20 frames per second.