arXiv reaDer
SM3D:単眼マッピングと3D検出の同時実行
SM3D: Simultaneous Monocular Mapping and 3D Detection
マッピングと3D検出は、ビジョンベースのロボット工学と自動運転の2つの主要な問題です。以前の作品は各タスクに個別に焦点を当てていますが、堅牢な深度推定と「疑似LiDAR」ポイントクラウドでギャップを埋めることにより、同時マッピングと3D検出のための革新的で効率的なマルチタスクディープラーニングフレームワーク(SM3D)を最初に提示します時間。マッピングモジュールは、連続する単眼フレームを使用して、深度とポーズの推定を生成します。 3D検出モジュールでは、深度推定が3D空間に投影され、「Pseudo-LiDAR」ポイントクラウドが生成されます。LiDARベースの3D検出器は、ポイントクラウドで車両の3D検出とローカリゼーションに利用できます。両方のモジュールのエンドツーエンドのトレーニングにより、提案されたマッピングと3D検出方法は、最先端のベースラインをそれぞれ10.0%と13.2%の精度で上回っています。単眼マルチタスクSM3Dは、より高い精度を実現しながら、純粋なステレオ3D検出器よりも2倍以上高速であり、2つのモジュールを別々に使用するよりも18.3%高速です。
Mapping and 3D detection are two major issues in vision-based robotics, and self-driving. While previous works only focus on each task separately, we present an innovative and efficient multi-task deep learning framework (SM3D) for Simultaneous Mapping and 3D Detection by bridging the gap with robust depth estimation and "Pseudo-LiDAR" point cloud for the first time. The Mapping module takes consecutive monocular frames to generate depth and pose estimation. In 3D Detection module, the depth estimation is projected into 3D space to generate "Pseudo-LiDAR" point cloud, where LiDAR-based 3D detector can be leveraged on point cloud for vehicular 3D detection and localization. By end-to-end training of both modules, the proposed mapping and 3D detection method outperforms the state-of-the-art baseline by 10.0% and 13.2% in accuracy, respectively. While achieving better accuracy, our monocular multi-task SM3D is more than 2 times faster than pure stereo 3D detector, and 18.3% faster than using two modules separately.
updated: Wed Nov 24 2021 17:23:37 GMT+0000 (UTC)
published: Wed Nov 24 2021 17:23:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト