この論文では、CPU計算のみでさまざまな環境でうまくスケーリングできる新しい高密度サーフェルマッピングシステムを提案します。提案されたマッピングシステムは、スパースSLAMシステムを使用してカメラポーズを推定し、強度画像と深度画像をグローバルに一貫したモデルに融合できます。このシステムは、RGB-Dカメラ、ステレオカメラ、さらには単眼カメラの深度画像を使用して、部屋規模の環境から都市規模の環境まで構築できるように慎重に設計されています。まず、強度と深度の両方の画像から抽出されたスーパーピクセルを使用して、システム内のサーフェルをモデル化します。スーパーピクセルベースのサーフェルは、メソッドを実行時とメモリの両方で効率的にします。第二に、再構築されたモデルのスケールに関係なく、$ O(1)$の融合時間を達成するために、サーフェルはSLAMシステムのポーズグラフに従ってさらに整理されます。第三に、最適化されたポーズグラフを使用した高速マップ変形により、マップはリアルタイムでグローバルな一貫性を実現できます。提案されたサーフェルマッピングシステムは、合成データセットに関する他の最先端の方法と比較されます。都市規模と部屋規模の再構築のパフォーマンスは、それぞれKITTIデータセットと自律的な積極的なフライトを使用して実証されています。コードはコミュニティの利益のために利用可能です。
In this paper, we propose a novel dense surfel mapping system that scales well in different environments with only CPU computation. Using a sparse SLAM system to estimate camera poses, the proposed mapping system can fuse intensity images and depth images into a globally consistent model. The system is carefully designed so that it can build from room-scale environments to urban-scale environments using depth images from RGB-D cameras, stereo cameras or even a monocular camera. First, superpixels extracted from both intensity and depth images are used to model surfels in the system. superpixel-based surfels make our method both run-time efficient and memory efficient. Second, surfels are further organized according to the pose graph of the SLAM system to achieve $O(1)$ fusion time regardless of the scale of reconstructed models. Third, a fast map deformation using the optimized pose graph enables the map to achieve global consistency in real-time. The proposed surfel mapping system is compared with other state-of-the-art methods on synthetic datasets. The performances of urban-scale and room-scale reconstruction are demonstrated using the KITTI dataset and autonomous aggressive flights, respectively. The code is available for the benefit of the community.