arXiv reaDer
MOST-GAN: 3D Morphable StyleGAN for Disentangled Face Image Manipulation
生成的敵対的ネットワーク(GAN)の最近の進歩により、顔画像合成に目覚ましい成果がもたらされました。スタイルベースのGANを使用する方法では、驚くほど写実的な顔画像を生成できますが、生成された顔の特性を意味のある、解きほぐされた方法で制御することは難しい場合がよくあります。以前のアプローチは、以前に訓練されたGANの潜在空間内でそのような意味論的制御と解きほぐしを達成することを目的としています。対照的に、3D形状、アルベド、ポーズ、照明などの顔の物理的属性を事前にモデル化して、設計による解きほぐしを提供するフレームワークを提案します。私たちの方法であるMOST-GANは、スタイルベースのGANの表現力とフォトリアリズムを、最先端の2Dヘアマニピュレーションネットワークと組み合わせた非線形3Dモーフィングモデルの物理的な解きほぐしと柔軟性と統合します。 MOST-GANは、物理属性を完全に解きほぐした3D制御により、ポートレート画像の写実的な操作を実現し、照明、顔の表情、ポーズのバリエーションをフルプロファイルビューまで極端に操作できるようにします。
Recent advances in generative adversarial networks (GANs) have led to remarkable achievements in face image synthesis. While methods that use style-based GANs can generate strikingly photorealistic face images, it is often difficult to control the characteristics of the generated faces in a meaningful and disentangled way. Prior approaches aim to achieve such semantic control and disentanglement within the latent space of a previously trained GAN. In contrast, we propose a framework that a priori models physical attributes of the face such as 3D shape, albedo, pose, and lighting explicitly, thus providing disentanglement by design. Our method, MOST-GAN, integrates the expressive power and photorealism of style-based GANs with the physical disentanglement and flexibility of nonlinear 3D morphable models, which we couple with a state-of-the-art 2D hair manipulation network. MOST-GAN achieves photorealistic manipulation of portrait images with fully disentangled 3D control over their physical attributes, enabling extreme manipulation of lighting, facial expression, and pose variations up to full profile view.
updated: Mon Nov 01 2021 15:53:36 GMT+0000 (UTC)
published: Mon Nov 01 2021 15:53:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト