arXiv reaDer
マルチビューステレオのためのノンパラメトリック深度分布モデリングベースの深度推論
Non-parametric Depth Distribution Modelling based Depth Inference for Multi-view Stereo
最近のコストボリュームピラミッドベースのディープニューラルネットワークは、マルチビューステレオからの深度推論に高解像度画像を効率的に活用する可能性を解き放ちました。一般に、これらのアプローチは、各ピクセルの深さが単峰性の分布に従うことを前提としています。境界ピクセルは、さまざまな深度を表すため、通常、マルチモーダル分布に従います。したがって、この仮定は、コストボリュームピラミッドのより粗いレベルで誤った深度予測をもたらし、誤った深度予測につながる改良レベルで修正することはできません。対照的に、ユニモーダルおよびマルチモーダル分布のピクセルを処理するために、ノンパラメトリック深度分布モデリングによってコストボリュームを構築することを提案します。私たちのアプローチは、初期段階でのエラーを回避するために、より粗いレベルで複数の深さの仮説を出力します。後続のレベルでこれらの複数の仮説の周りでローカル検索を実行するとき、私たちのアプローチは厳密な深さの空間順序を維持しないため、各ボリューム内の情報を導出するためにスパースコスト集計ネットワークを導入します。 DTUとTanks&Templesの2つのベンチマークデータセットでアプローチを広範囲に評価します。私たちの実験結果は、私たちのモデルが既存の方法を大幅に上回り、境界領域で優れたパフォーマンスを達成することを示しています。コードはhttps://github.com/NVlabs/NP-CVP-MVSNetで入手できます。
Recent cost volume pyramid based deep neural networks have unlocked the potential of efficiently leveraging high-resolution images for depth inference from multi-view stereo. In general, those approaches assume that the depth of each pixel follows a unimodal distribution. Boundary pixels usually follow a multi-modal distribution as they represent different depths; Therefore, the assumption results in an erroneous depth prediction at the coarser level of the cost volume pyramid and can not be corrected in the refinement levels leading to wrong depth predictions. In contrast, we propose constructing the cost volume by non-parametric depth distribution modeling to handle pixels with unimodal and multi-modal distributions. Our approach outputs multiple depth hypotheses at the coarser level to avoid errors in the early stage. As we perform local search around these multiple hypotheses in subsequent levels, our approach does not maintain the rigid depth spatial ordering and, therefore, we introduce a sparse cost aggregation network to derive information within each volume. We evaluate our approach extensively on two benchmark datasets: DTU and Tanks & Temples. Our experimental results show that our model outperforms existing methods by a large margin and achieves superior performance on boundary regions. Code is available at https://github.com/NVlabs/NP-CVP-MVSNet
updated: Sun May 08 2022 05:13:04 GMT+0000 (UTC)
published: Sun May 08 2022 05:13:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト