arXiv reaDer
ニューラル屋内シーン再構築のための P^2SDF
P^2SDF for Neural Indoor Scene Reconstruction
一連の画像のみが与えられた場合、ニューラルの暗黙的な表面表現は、3D 表面再構成におけるその能力を示しています。ただし、シーンごとの最適化の性質は、色のボリューム レンダリングに基づいているため、以前のニューラルの暗黙的な表面再構築方法は、通常、屋内シーンに一般的に存在する床、壁などを含むテクスチャの少ない領域では失敗します。これらの低テクスチャ領域は通常平面に対応するという事実を認識しており、追加のグラウンドトゥルース監視信号を導入したり、部屋のレイアウトについて追加の仮定を行ったりすることなく、新しい疑似平面正則化符号付き距離場 (P^2SDF) を活用することを提案します。 ) 屋内シーンの再構成用。具体的には、似た色の隣接するピクセルは同じ疑似平面上にあると見なします。次に、効率的かつ効果的な 2 段階のスキームによって、トレーニング中に平面パラメーターがオンザフライで推定されます。次に、平面上のポイントの符号付き距離は、トレーニング段階で推定された平面パラメーターによって正則化されます。監視されていない平面セグメントは通常、ノイズが多く不正確であるため、平面推定と正則化損失で平面上のサンプリングされたポイントに異なる重みを割り当てることを提案します。重みは、異なるビューからの平面セグメントを融合することによって得られます。平面領域でサンプリングされたレイは冗長であり、非効率的なトレーニングにつながるため、色の変化が大きい有益なテクスチャ領域に注意を向けるキーポイント ガイド レイ サンプリング戦略をさらに提案します。オリジナルの一様レイサンプリング戦略。実験では、P^2SDF がマンハッタンのシーンで競争力のある再構築パフォーマンスを達成することが示されています。さらに、追加の部屋レイアウトの仮定を導入しないため、P^2SDF は非マンハッタン シーンの再構築によく一般化されます。
Given only a set of images, neural implicit surface representation has shown its capability in 3D surface reconstruction. However, as the nature of per-scene optimization is based on the volumetric rendering of color, previous neural implicit surface reconstruction methods usually fail in low-textured regions, including the floors, walls, etc., which commonly exist for indoor scenes. Being aware of the fact that these low-textured regions usually correspond to planes, without introducing additional ground-truth supervisory signals or making additional assumptions about the room layout, we propose to leverage a novel Pseudo Plane-regularized Signed Distance Field (P^2SDF) for indoor scene reconstruction. Specifically, we consider adjacent pixels with similar colors to be on the same pseudo planes. The plane parameters are then estimated on the fly during training by an efficient and effective two-step scheme. Then the signed distances of the points on the planes are regularized by the estimated plane parameters in the training phase. As the unsupervised plane segments are usually noisy and inaccurate, we propose to assign different weights to the sampled points on the plane in plane estimation as well as the regularization loss. The weights come by fusing the plane segments from different views. As the sampled rays in the planar regions are redundant, leading to inefficient training, we further propose a keypoint-guided rays sampling strategy that attends to the informative textured regions with large color variations, and the implicit network gets a better reconstruction, compared with the original uniform ray sampling strategy. Experiments show that our P^2SDF achieves competitive reconstruction performance in Manhattan scenes. Further, as we do not introduce any additional room layout assumption, our P^2SDF generalizes well to the reconstruction of non-Manhattan scenes.
updated: Wed Mar 01 2023 05:07:48 GMT+0000 (UTC)
published: Wed Mar 01 2023 05:07:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト