arXiv reaDer
生成制御のためのマルチレベル潜在空間構造
Multi-level Latent Space Structuring for Generative Control
切り捨ては、生成されたサンプルの多様性を減らすことを犠牲にして、生成されたサンプルの品質を向上させるための生成モデルで広く使用されています。 StyleGAN生成アーキテクチャを活用して、潜在空間のクラスターへの分解に基づく新しい切り捨て手法を考案し、カスタマイズされた切り捨てを複数のセマンティックレベルで実行できるようにすることを提案します。これを行うには、学習可能なガウス分布の混合を使用して、StyleGANの拡張中間潜在空間であるW空間の再生成を学習すると同時に、分類器をトレーニングして、各潜在ベクトルについて、それが属するクラスターを識別します。結果として得られる切り捨てスキームは、元の切り捨てられていないサンプルにより忠実であり、品質と多様性の間のより良いトレードオフを可能にします。私たちの方法を、定性的および定量的に、StyleGANの他の切り捨てアプローチと比較します。
Truncation is widely used in generative models for improving the quality of the generated samples, at the expense of reducing their diversity. We propose to leverage the StyleGAN generative architecture to devise a new truncation technique, based on a decomposition of the latent space into clusters, enabling customized truncation to be performed at multiple semantic levels. We do so by learning to re-generate W-space, the extended intermediate latent space of StyleGAN, using a learnable mixture of Gaussians, while simultaneously training a classifier to identify, for each latent vector, the cluster that it belongs to. The resulting truncation scheme is more faithful to the original untruncated samples and allows a better trade-off between quality and diversity. We compare our method to other truncation approaches for StyleGAN, both qualitatively and quantitatively.
updated: Fri Feb 11 2022 21:26:17 GMT+0000 (UTC)
published: Fri Feb 11 2022 21:26:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト