arXiv reaDer
Unsupervised Depth Completion from Visual Inertial Odometry
 視覚慣性オドメトリシステムを使用して推定されるカメラの動きとまばらな深度から密な深度を推測する方法を説明します。 LIDARまたは構造化された光センサーからの点群を使用する他のシナリオとは異なり、数百から数千の点があり、シーンのトポロジを通知するには不十分です。私たちの方法は、最初にシーンの区分的平面足場を構築し、次にそれを使用して、画像とスパースポイントを使用して高密度の深度を推測します。 「自己監視」に似た予測的クロスモーダル基準を使用して、経時的な測光の一貫性、前後の姿勢の一貫性、およびスパースポイントクラウドとの幾何学的な互換性を測定します。また、最初の視覚慣性+深度データセットを開始します。これにより、視覚センサーと慣性センサーの補完的な強さを組み合わせた追加の調査が促進されます。この方法を以前の作業と比較するために、教師なしKITTI深度完了ベンチマークを採用し、最新のパフォーマンスを示します。
We describe a method to infer dense depth from camera motion and sparse depth as estimated using a visual-inertial odometry system. Unlike other scenarios using point clouds from lidar or structured light sensors, we have few hundreds to few thousand points, insufficient to inform the topology of the scene. Our method first constructs a piecewise planar scaffolding of the scene, and then uses it to infer dense depth using the image along with the sparse points. We use a predictive cross-modal criterion, akin to `self-supervision,' measuring photometric consistency across time, forward-backward pose consistency, and geometric compatibility with the sparse point cloud. We also launch the first visual-inertial + depth dataset, which we hope will foster additional exploration into combining the complementary strengths of visual and inertial sensors. To compare our method to prior work, we adopt the unsupervised KITTI depth completion benchmark, and show state-of-the-art performance on it.
updated: Tue Feb 11 2020 03:51:28 GMT+0000 (UTC)
published: Wed May 15 2019 03:47:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト