arXiv reaDer
3DVNet:マルチビュー深度予測とボリュームリファインメント
3DVNet: Multi-View Depth Prediction and Volumetric Refinement
3DVNet、以前の深度ベースとボリュームMVSアプローチの利点を組み合わせた新しいマルチビューステレオ(MVS)深度予測方法を紹介します。私たちの重要なアイデアは、3Dシーンモデリングネットワークを使用して、粗い深度予測のセットを繰り返し更新し、基礎となるシーンジオメトリに一致する非常に正確な予測を実現することです。既存の深度予測手法とは異なり、私たちの方法では、すべての深度マップの世界空間で共同で動作する体積3D畳み込みニューラルネットワーク(CNN)を使用します。したがって、ネットワークは意味のあるシーンレベルの事前情報を学習できます。さらに、既存のボリュームMVS手法とは異なり、当社の3D CNNは、機能が拡張された点群で動作するため、マルチビュー情報の効果的な集約と深度マップの柔軟な反復改良が可能になります。実験結果は、私たちの方法が、ScanNetデータセットの深度予測と3D再構成メトリックの両方、およびTUM-RGBDとICL-NUIMデータセットからのシーンの選択において、最先端の精度を超えていることを示しています。これは、私たちの方法が効果的であり、新しい設定に一般化されていることを示しています。
We present 3DVNet, a novel multi-view stereo (MVS) depth-prediction method that combines the advantages of previous depth-based and volumetric MVS approaches. Our key idea is the use of a 3D scene-modeling network that iteratively updates a set of coarse depth predictions, resulting in highly accurate predictions which agree on the underlying scene geometry. Unlike existing depth-prediction techniques, our method uses a volumetric 3D convolutional neural network (CNN) that operates in world space on all depth maps jointly. The network can therefore learn meaningful scene-level priors. Furthermore, unlike existing volumetric MVS techniques, our 3D CNN operates on a feature-augmented point cloud, allowing for effective aggregation of multi-view information and flexible iterative refinement of depth maps. Experimental results show our method exceeds state-of-the-art accuracy in both depth prediction and 3D reconstruction metrics on the ScanNet dataset, as well as a selection of scenes from the TUM-RGBD and ICL-NUIM datasets. This shows that our method is both effective and generalizes to new settings.
updated: Wed Dec 01 2021 00:52:42 GMT+0000 (UTC)
published: Wed Dec 01 2021 00:52:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト