arXiv reaDer
単一画像からの屋内シーンのニューラル逆レンダリング
Neural Inverse Rendering of an Indoor Scene from a Single Image
  逆レンダリングの目的は、画像から反射率、ジオメトリ、照明などのシーンの物理的属性を推定することです。インバースレンダリングは、主に単一のオブジェクトについて、またはシーン属性の1つのみを解決するメソッドを使用して研究されています。単一の画像から屋内シーンのアルベド、法線、照明を共同で推定する最初の学習ベースのアプローチを提案します。私たちの主な貢献は、複雑な外観効果(相互反射、影の投影、近接場照明、現実的なシェーディングなど)を合成するようにトレーニングできる残余外観レンダラー(RAR)です。これにより、推定されたコンポーネントから入力画像を再合成することに基づいて、再構築損失を使用して実データで自己監視学習を実行できます。合成データで事前トレーニングした後、実際のデータで微調整します。そのために、物理ベースのレンダリングを使用して大規模な合成データセットを作成します。これは、以前のデータセットよりも大幅に改善されています。実験結果は、私たちのアプローチが1つ以上のシーン属性を推定する最先端の方法よりも優れていることを示しています。
Inverse rendering aims to estimate physical attributes of a scene, e.g., reflectance, geometry, and lighting, from image(s). Inverse rendering has been studied primarily for single objects or with methods that solve for only one of the scene attributes. We propose the first learning-based approach that jointly estimates albedo, normals, and lighting of an indoor scene from a single image. Our key contribution is the Residual Appearance Renderer (RAR), which can be trained to synthesize complex appearance effects (e.g., inter-reflection, cast shadows, near-field illumination, and realistic shading), which would be neglected otherwise. This enables us to perform self-supervised learning on real data using a reconstruction loss, based on re-synthesizing the input image from the estimated components. We finetune with real data after pretraining with synthetic data. To this end, we use physically-based rendering to create a large-scale synthetic dataset, which is a significant improvement over prior datasets. Experimental results show that our approach outperforms state-of-the-art methods that estimate one or more scene attributes.
updated: Sat Sep 14 2019 07:24:52 GMT+0000 (UTC)
published: Tue Jan 08 2019 17:12:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト