この論文では、ステレオカメラシステムのみに基づく3Dセマンティックマッピングの完全なパイプラインを紹介します。パイプラインは、直接スパース視覚オドメトリのフロントエンドと、GNSS統合やセマンティック3Dポイントクラウドラベリングを含むグローバル最適化のためのバックエンドで構成されています。 3Dポイントラベルの品質と一貫性を向上させる、シンプルで効果的な時間投票スキームを提案します。パイプラインの定性的および定量的評価は、KITTI-360データセットで実行されます。結果は、提案された投票スキームの有効性と、効率的な大規模3Dセマンティックマッピングのためのパイプラインの機能を示しています。パイプラインの大規模なマッピング機能は、車両のフリートによって収集されたデータから生成された8000kmの道路をカバーする非常に大規模なセマンティックマップを提示することによってさらに実証されます。
In this paper, we present a complete pipeline for 3D semantic mapping solely based on a stereo camera system. The pipeline comprises a direct sparse visual odometry front-end as well as a back-end for global optimization including GNSS integration, and semantic 3D point cloud labeling. We propose a simple but effective temporal voting scheme which improves the quality and consistency of the 3D point labels. Qualitative and quantitative evaluations of our pipeline are performed on the KITTI-360 dataset. The results show the effectiveness of our proposed voting scheme and the capability of our pipeline for efficient large-scale 3D semantic mapping. The large-scale mapping capabilities of our pipeline is furthermore demonstrated by presenting a very large-scale semantic map covering 8000 km of roads generated from data collected by a fleet of vehicles.