arXiv reaDer
PatchMatch-RL: Deep MVS with Pixelwise Depth, Normal, and Visibility
最近の学習ベースのマルチビューステレオ(MVS)メソッドは、高密度カメラと狭い深度範囲で優れたパフォーマンスを示します。ただし、非学習ベースのアプローチは、深度、法線、および可視性のピクセル単位の推定に対するPatchMatchの最適化に一部起因して、深度範囲が広く、ベースラインビューがまばらなシーンでは依然として優れています。このホワイトペーパーでは、トレーニング可能なコストと正則化の利点をピクセル単位の推定値と組み合わせた、エンドツーエンドのトレーニング可能なPatchMatchベースのMVSアプローチを提案します。反復サンプリングと難しい決定を含む微分不可能なPatchMatch最適化の課題を克服するために、強化学習を使用して、予想される測光コストを最小化し、グラウンドトゥルースの深さと法線の可能性を最大化します。拡張パッチカーネルを使用して法線推定を組み込み、前額面スイープアルゴリズムを超えてピクセル単位の深さ/法線推定に適用される反復コスト正則化を提案します。広く使用されているMVSベンチマーク、ETH3D、Tanks and Temples(TnT)でメソッドを評価し、他の最先端の学習ベースのMVSモデルと比較します。 ETH3Dでは、私たちの方法は他の最近の学習ベースのアプローチよりも優れており、高度なTnTで同等に機能します。
Recent learning-based multi-view stereo (MVS) methods show excellent performance with dense cameras and small depth ranges. However, non-learning based approaches still outperform for scenes with large depth ranges and sparser wide-baseline views, in part due to their PatchMatch optimization over pixelwise estimates of depth, normals, and visibility. In this paper, we propose an end-to-end trainable PatchMatch-based MVS approach that combines advantages of trainable costs and regularizations with pixelwise estimates. To overcome the challenge of the non-differentiable PatchMatch optimization that involves iterative sampling and hard decisions, we use reinforcement learning to minimize expected photometric cost and maximize likelihood of ground truth depth and normals. We incorporate normal estimation by using dilated patch kernels, and propose a recurrent cost regularization that applies beyond frontal plane-sweep algorithms to our pixelwise depth/normal estimates. We evaluate our method on widely used MVS benchmarks, ETH3D and Tanks and Temples (TnT), and compare to other state of the art learning based MVS models. On ETH3D, our method outperforms other recent learning-based approaches and performs comparably on advanced TnT.
updated: Thu Aug 19 2021 23:14:48 GMT+0000 (UTC)
published: Thu Aug 19 2021 23:14:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト