arXiv reaDer
単一の GAN イメージからの制御可能な表情による 3D 漫画の顔の生成
3D Cartoon Face Generation with Controllable Expressions from a Single GAN Image
この論文では、単一の 2D GAN で生成された人間の顔から 3D 監督なしで 3D 漫画の顔の形を生成するという公開研究タスクを調査します。この場合、3D 形の表情を操作することもできます。この目的のために、潜在コードを制御することで、さまざまな表情、ポーズ、および照明の顔画像を生成できるように、StyleGAN 潜在空間の意味的な意味を発見します。具体的には、まず、漫画のデータセットで事前トレーニング済みの StyleGAN 顔モデルを微調整します。顔と漫画の生成モデルに同じ潜在コードを供給することにより、2D の人間の顔画像から漫画スタイルのアバターへの変換を実現することを目指しています。次に、元のアイデンティティを維持しながら顔の表情を変更しようとして、GAN潜在空間の意味方向を発見します。漫画の顔の 3D 注釈がないため、潜在的なコードを操作して、さまざまなポーズと照明で画像を生成し、3D の漫画の顔の形状を再構築できるようにします。 3 つの漫画データセットに対する手法の有効性を定性的および定量的に検証します。
In this paper, we investigate an open research task of generating 3D cartoon face shapes from single 2D GAN generated human faces and without 3D supervision, where we can also manipulate the facial expressions of the 3D shapes. To this end, we discover the semantic meanings of StyleGAN latent space, such that we are able to produce face images of various expressions, poses, and lighting by controlling the latent codes. Specifically, we first finetune the pretrained StyleGAN face model on the cartoon datasets. By feeding the same latent codes to face and cartoon generation models, we aim to realize the translation from 2D human face images to cartoon styled avatars. We then discover semantic directions of the GAN latent space, in an attempt to change the facial expressions while preserving the original identity. As we do not have any 3D annotations for cartoon faces, we manipulate the latent codes to generate images with different poses and lighting, such that we can reconstruct the 3D cartoon face shapes. We validate the efficacy of our method on three cartoon datasets qualitatively and quantitatively.
updated: Fri Jul 29 2022 01:06:21 GMT+0000 (UTC)
published: Fri Jul 29 2022 01:06:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト