この調査の目的は、顔の生成と編集のための最先端の深層学習技術の概要を提供することです。人気のある最新のアーキテクチャをカバーし、反転、潜在表現、損失関数、トレーニング手順、編集方法、クロスドメイン スタイル転送など、それらを機能させる重要なアイデアについて説明します。私たちは特に、高品質の顔画像の生成を可能にし、制御可能なセマンティクス編集と写真品質の維持のための豊富なインターフェイスを提供する StyleGAN アプローチで最高潮に達した GAN ベースのアーキテクチャに焦点を当てています。深層学習の分野に関する基本的な知識を持ち、アクセスしやすい紹介と概要を探している読者に、この分野への入り口を提供することを目指しています。
Our goal with this survey is to provide an overview of the state of the art deep learning technologies for face generation and editing. We will cover popular latest architectures and discuss key ideas that make them work, such as inversion, latent representation, loss functions, training procedures, editing methods, and cross domain style transfer. We particularly focus on GAN-based architectures that have culminated in the StyleGAN approaches, which allow generation of high-quality face images and offer rich interfaces for controllable semantics editing and preserving photo quality. We aim to provide an entry point into the field for readers that have basic knowledge about the field of deep learning and are looking for an accessible introduction and overview.