実際のシーンの外観をモデリングするための新しいポイントベースのアプローチを紹介します。このアプローチでは、シーンの幾何学的表現として生の点群を使用し、ローカルジオメトリと外観をエンコードする学習可能な神経記述子を各点に追加します。ディープレンダリングネットワークが記述子と並行して学習されるため、このネットワークを介して新しい視点からの点群のラスタライゼーションを渡すことで、シーンの新しいビューを取得できます。入力のラスタライズでは、学習した記述子を点の疑似カラーとして使用します。提案されたアプローチは、複雑なシーンのモデリングとその写実的なビューの取得に使用でき、明示的な表面推定とメッシュ作成を回避できることを示しています。特に、標準的なメッシュベースのモデリングが難しいオブジェクトが存在する場合でも、ハンドヘルドの商品RGB-Dセンサーと標準的なRGBカメラを使用してスキャンしたシーンでは、説得力のある結果が得られます。
We present a new point-based approach for modeling the appearance of real scenes. The approach uses a raw point cloud as the geometric representation of a scene, and augments each point with a learnable neural descriptor that encodes local geometry and appearance. A deep rendering network is learned in parallel with the descriptors, so that new views of the scene can be obtained by passing the rasterizations of a point cloud from new viewpoints through this network. The input rasterizations use the learned descriptors as point pseudo-colors. We show that the proposed approach can be used for modeling complex scenes and obtaining their photorealistic views, while avoiding explicit surface estimation and meshing. In particular, compelling results are obtained for scene scanned using hand-held commodity RGB-D sensors as well as standard RGB cameras even in the presence of objects that are challenging for standard mesh-based modeling.