最近、深層学習ベースの3D顔再構成法は、品質と効率の両方で有望な結果を示していますが、ディープニューラルネットワークのトレーニングには通常大量のデータが必要ですが、グラウンドトゥルース3D顔の形状の顔画像は不足しています。この論文では、1)監督のために低レベルと知覚レベルの両方の情報を考慮に入れて、弱教師付き学習のためのロバストなハイブリッド損失関数を活用し、2)マルチ形状集約のために異なる画像からの補足情報を活用することによる画像顔再構成。私たちの方法は、高速かつ正確で、オクルージョンや大きなポーズに対して堅牢です。 3つのデータセットについて包括的な実験を行い、手法を15の最近の手法と体系的に比較して、その最先端のパフォーマンスを実証します。
Recently, deep learning based 3D face reconstruction methods have shown promising results in both quality and efficiency.However, training deep neural networks typically requires a large volume of data, whereas face images with ground-truth 3D face shapes are scarce. In this paper, we propose a novel deep 3D face reconstruction approach that 1) leverages a robust, hybrid loss function for weakly-supervised learning which takes into account both low-level and perception-level information for supervision, and 2) performs multi-image face reconstruction by exploiting complementary information from different images for shape aggregation. Our method is fast, accurate, and robust to occlusion and large pose. We provide comprehensive experiments on three datasets, systematically comparing our method with fifteen recent methods and demonstrating its state-of-the-art performance.