arXiv reaDer
自己教師あり学習とレイトレーシングを使用した、反射率の高い高忠実度の単眼顔再構成に向けて
Towards High Fidelity Monocular Face Reconstruction with Rich Reflectance using Self-supervised Learning and Ray Tracing
一般的な照明条件での単眼画像からのロバストな顔の再構成は困難です。ディープニューラルネットワークエンコーダーと微分可能なレンダリングを組み合わせた方法により、ジオメトリ、照明、反射率の非常に高速な単眼再構築への道が開かれました。また、堅牢性を高め、一般化を改善するために、自己監視方式でトレーニングすることもできます。ただし、それらの微分可能なラスタライズベースの画像形成モデル、および基礎となるシーンのパラメータ化により、ランバート面の反射率と不十分な形状の詳細に制限されます。最近では、古典的な最適化ベースのフレームワーク内で単眼顔の再構築のためにレイトレーシングが導入され、最先端の結果が可能になりました。ただし、最適化ベースのアプローチは本質的に遅く、堅牢性に欠けています。本論文では、前述のアプローチに基づいて作業を構築し、一般的なシーンでの再構成の品質と堅牢性を大幅に向上させる新しい方法を提案します。これは、CNNエンコーダーと微分可能なレイトレーサーを組み合わせることで実現します。これにより、はるかに高度なパーソナライズされた拡散および鏡面アルベド、より洗練された照明モデル、および自己影のもっともらしい表現に基づいて再構成を行うことができます。これにより、照明が難しいシーンでも、形状、外観、照明の再構成品質を大きく飛躍させることができます。一貫した顔属性の再構築により、私たちの方法は、再照明や自己影の除去などの実用的なアプリケーションにつながります。最先端の方法と比較して、私たちの結果は、アプローチの精度と妥当性が向上していることを示しています。
Robust face reconstruction from monocular image in general lighting conditions is challenging. Methods combining deep neural network encoders with differentiable rendering have opened up the path for very fast monocular reconstruction of geometry, lighting and reflectance. They can also be trained in self-supervised manner for increased robustness and better generalization. However, their differentiable rasterization based image formation models, as well as underlying scene parameterization, limit them to Lambertian face reflectance and to poor shape details. More recently, ray tracing was introduced for monocular face reconstruction within a classic optimization-based framework and enables state-of-the art results. However optimization-based approaches are inherently slow and lack robustness. In this paper, we build our work on the aforementioned approaches and propose a new method that greatly improves reconstruction quality and robustness in general scenes. We achieve this by combining a CNN encoder with a differentiable ray tracer, which enables us to base the reconstruction on much more advanced personalized diffuse and specular albedos, a more sophisticated illumination model and a plausible representation of self-shadows. This enables to take a big leap forward in reconstruction quality of shape, appearance and lighting even in scenes with difficult illumination. With consistent face attributes reconstruction, our method leads to practical applications such as relighting and self-shadows removal. Compared to state-of-the-art methods, our results show improved accuracy and validity of the approach.
updated: Mon Nov 22 2021 08:48:25 GMT+0000 (UTC)
published: Mon Mar 29 2021 08:58:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト