arXiv reaDer
GeoNet ++:ジョイントの深さと表面法線推定のためのエッジ認識リファインメントを備えた反復幾何学的ニューラルネットワーク
GeoNet++: Iterative Geometric Neural Network with Edge-Aware Refinement for Joint Depth and Surface Normal Estimation
この論文では、単一の画像から深度と表面の法線マップの両方を共同で予測するために、エッジ認識リファインメント(GeoNet ++)を備えた幾何学的ニューラルネットワークを提案します。 GeoNet ++は、2ストリームCNNの上に構築されており、提案された深度から法線および法線から深度へのモジュールを使用して、深度と表面法線の間の幾何学的関係をキャプチャします。特に、「depth-to-normal」モジュールは、深さから表面法線を推定する最小二乗解を利用して品質を向上させ、「normal-to-depth」モジュールは、表面法線の制約に基づいて深さマップを改良します。カーネル回帰。境界情報は、エッジ認識リファインメントモジュールを介して悪用されます。 GeoNet ++は、3Dの一貫性が高く、境界がシャープな深度と表面の法線を効果的に予測し、3Dシーンをより適切に再構築します。 GeoNet ++は汎用であり、他の深度/法線予測フレームワークで使用して、3D再構成の品質と深度および表面法線のピクセル単位の精度を向上させることができることに注意してください。さらに、3Dで深度予測を評価するための新しい3D幾何学的メトリック(3DGM)を提案します。ピクセル単位のエラー/精度の評価に焦点を当てた現在のメトリックとは対照的に、3DGMは、予測された深度が高品質の3D表面法線を再構築できるかどうかを測定します。これは、多くの3Dアプリケーションドメインにとってより自然な指標です。 NYUD-V2およびKITTIデータセットでの実験により、GeoNet ++が細かい境界の詳細を生成し、予測された深度を使用して高品質の3Dサーフェスを再構築できることが確認されました。コードは公開されています。
In this paper, we propose a geometric neural network with edge-aware refinement (GeoNet++) to jointly predict both depth and surface normal maps from a single image. Building on top of two-stream CNNs, GeoNet++ captures the geometric relationships between depth and surface normals with the proposed depth-to-normal and normal-to-depth modules. In particular, the "depth-to-normal" module exploits the least square solution of estimating surface normals from depth to improve their quality, while the "normal-to-depth" module refines the depth map based on the constraints on surface normals through kernel regression. Boundary information is exploited via an edge-aware refinement module. GeoNet++ effectively predicts depth and surface normals with strong 3D consistency and sharp boundaries resulting in better reconstructed 3D scenes. Note that GeoNet++ is generic and can be used in other depth/normal prediction frameworks to improve the quality of 3D reconstruction and pixel-wise accuracy of depth and surface normals. Furthermore, we propose a new 3D geometric metric (3DGM) for evaluating depth prediction in 3D. In contrast to current metrics that focus on evaluating pixel-wise error/accuracy, 3DGM measures whether the predicted depth can reconstruct high-quality 3D surface normals. This is a more natural metric for many 3D application domains. Our experiments on NYUD-V2 and KITTI datasets verify that GeoNet++ produces fine boundary details, and the predicted depth can be used to reconstruct high-quality 3D surfaces. Code has been made publicly available.
updated: Sun Dec 13 2020 06:48:01 GMT+0000 (UTC)
published: Sun Dec 13 2020 06:48:01 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト