arXiv reaDer
StyleGAN画像レイアウト編集用のユーザー制御可能なLatent Transformer
User-Controllable Latent Transformer for StyleGAN Image Layout Editing
潜在空間探査は、解釈可能な潜在方向を発見し、潜在コードを操作して敵対的生成ネットワーク (GAN) によって生成された画像のさまざまな属性を編集する手法です。しかし、これまでの研究では、空間制御は単純な変換 (平行移動や回転など) に限定されており、適切な潜在方向を特定してそのパラメーターを調整するのは面倒でした。この論文では、画像に直接注釈を付けることにより、StyleGAN 画像レイアウトの編集の問題に取り組みます。そのために、ユーザー入力に従って潜在コードを操作するためのインタラクティブなフレームワークを提案します。私たちのフレームワークでは、ユーザーは StyleGAN 画像に移動する場所または移動しない場所で注釈を付け、マウスのドラッグで移動方向を指定します。これらのユーザー入力と初期潜在コードから、Transformer エンコーダー/デコーダー アーキテクチャに基づく潜在トランスフォーマーが出力潜在コードを推定し、それが StyleGAN ジェネレーターに渡されて結果イメージを取得します。潜在的なトランスフォーマーをトレーニングするために、合成データと、既製の StyleGAN とオプティカル フロー モデルによって生成された疑似ユーザー入力を、手動による監視なしで利用します。定量的および定性的な評価は、既存の方法に対する私たちの方法の有効性を示しています。
Latent space exploration is a technique that discovers interpretable latent directions and manipulates latent codes to edit various attributes in images generated by generative adversarial networks (GANs). However, in previous work, spatial control is limited to simple transformations (e.g., translation and rotation), and it is laborious to identify appropriate latent directions and adjust their parameters. In this paper, we tackle the problem of editing the StyleGAN image layout by annotating the image directly. To do so, we propose an interactive framework for manipulating latent codes in accordance with the user inputs. In our framework, the user annotates a StyleGAN image with locations they want to move or not and specifies a movement direction by mouse dragging. From these user inputs and initial latent codes, our latent transformer based on a transformer encoder-decoder architecture estimates the output latent codes, which are fed to the StyleGAN generator to obtain a result image. To train our latent transformer, we utilize synthetic data and pseudo-user inputs generated by off-the-shelf StyleGAN and optical flow models, without manual supervision. Quantitative and qualitative evaluations demonstrate the effectiveness of our method over existing methods.
updated: Fri Aug 26 2022 02:48:42 GMT+0000 (UTC)
published: Fri Aug 26 2022 02:48:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト