既存の3D対応の顔の生成方法は、品質と編集可能性のジレンマに直面しています。編集可能な結果を低解像度で生成するか、編集の柔軟性のない高品質の結果を生成します。この作品では、両方の長所を組み合わせた新しいアプローチを提案します。私たちのシステムは、次の3つの主要なコンポーネントで構成されています。 (2)セマンティックおよびテクスチャエンコーダからの潜在コードを初期化し、忠実な再構築のためにそれらをさらに最適化するハイブリッドGAN反転アプローチ。 (3)正規ビューでのセマンティックマスクの効率的な操作と製品の高品質な編集結果を可能にする正規エディター。私たちのアプローチは、フリービューの顔の描画、編集、スタイル制御など、多くのアプリケーションに対応しています。定量的および定性的な結果の両方が、私たちの方法がフォトリアリズム、忠実さ、および効率の点で最先端に到達していることを示しています。
Existing 3D-aware facial generation methods face a dilemma in quality versus editability: they either generate editable results in low resolution or high-quality ones with no editing flexibility. In this work, we propose a new approach that brings the best of both worlds together. Our system consists of three major components: (1) a 3D-semantics-aware generative model that produces view-consistent, disentangled face images and semantic masks; (2) a hybrid GAN inversion approach that initialize the latent codes from the semantic and texture encoder, and further optimized them for faithful reconstruction; and (3) a canonical editor that enables efficient manipulation of semantic masks in canonical view and product high-quality editing results. Our approach is competent for many applications, e.g. free-view face drawing, editing, and style control. Both quantitative and qualitative results show that our method reaches the state-of-the-art in terms of photorealism, faithfulness, and efficiency.