多様なソースから3D顔パラメトリックモデルと3D顔再構成を共同で学習するための新しい方法を提示します。以前の方法では、通常、スキャンされたデータや実際の画像など、1種類のソースから3D顔モデリングを学習します。 3Dスキャンされたデータには顔の形の正確な幾何学的情報が含まれていますが、キャプチャシステムは高価であり、そのようなデータセットには通常少数の被写体が含まれています。一方、野生の顔画像は簡単に取得でき、顔画像も多い。ただし、顔の画像には明示的な幾何学的情報は含まれていません。本論文では、多様な情報源から統一された顔モデルを学習する方法を提案する。スキャンした顔データと顔画像に加えて、iPhone Xでキャプチャした多数のRGB-D画像を利用して、2つのソース間のギャップを埋めます。実験結果は、より多くのソースからのトレーニングデータを使用して、より強力な顔モデルを学習できることを示しています。
We present a novel method to jointly learn a 3D face parametric model and 3D face reconstruction from diverse sources. Previous methods usually learn 3D face modeling from one kind of source, such as scanned data or in-the-wild images. Although 3D scanned data contain accurate geometric information of face shapes, the capture system is expensive and such datasets usually contain a small number of subjects. On the other hand, in-the-wild face images are easily obtained and there are a large number of facial images. However, facial images do not contain explicit geometric information. In this paper, we propose a method to learn a unified face model from diverse sources. Besides scanned face data and face images, we also utilize a large number of RGB-D images captured with an iPhone X to bridge the gap between the two sources. Experimental results demonstrate that with training data from more sources, we can learn a more powerful face model.