arXiv reaDer
過剰パラメータ化はStyleGAN反転を改善します
Overparameterization Improves StyleGAN Inversion
StyleGANのような深い生成モデルは、セマンティック画像編集の可能性を秘めています。つまり、ピクセル値ではなく、コンテンツによって画像を変更します。残念ながら、任意の画像を操作するには、StyleGANジェネレーターを反転する必要がありますが、これはこれまでのところ困難な状況です。既存の反転アプローチでは、再構築の品質とダウンストリームの編集可能性の間でトレードオフを行う必要があるため、有望でありながら不完全な結果が得られます。品質を向上させるために、これらのアプローチは、トレーニング後にモデルの潜在空間を拡張するさまざまな手法に頼らなければなりません。一歩後退すると、これらの方法は本質的にすべて、何らかの方法で、自由パラメーターの数を増やすことを提案していることがわかります。これは、制約が不足しているため、反転が難しい可能性があることを示しています。この作業では、トレーニングの前に、元のStyleGANアーキテクチャに簡単な変更を加えて、潜在的なスペースを直接かつ劇的にオーバーパラメータ化します。パラメータ化が過剰になると、利用可能な自由度が増加し、反転が容易になります。これにより、エンコーダを必要とせず、トレーニング後に潜在空間を変更することなく、ほぼ完全な画像再構成を取得できることを示します。私たちのアプローチは、画像間の現実的な補間によって実証する編集可能性も保持しています。
Deep generative models like StyleGAN hold the promise of semantic image editing: modifying images by their content, rather than their pixel values. Unfortunately, working with arbitrary images requires inverting the StyleGAN generator, which has remained challenging so far. Existing inversion approaches obtain promising yet imperfect results, having to trade-off between reconstruction quality and downstream editability. To improve quality, these approaches must resort to various techniques that extend the model latent space after training. Taking a step back, we observe that these methods essentially all propose, in one way or another, to increase the number of free parameters. This suggests that inversion might be difficult because it is underconstrained. In this work, we address this directly and dramatically overparameterize the latent space, before training, with simple changes to the original StyleGAN architecture. Our overparameterization increases the available degrees of freedom, which in turn facilitates inversion. We show that this allows us to obtain near-perfect image reconstruction without the need for encoders nor for altering the latent space after training. Our approach also retains editability, which we demonstrate by realistically interpolating between images.
updated: Thu May 12 2022 18:42:43 GMT+0000 (UTC)
published: Thu May 12 2022 18:42:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト