arXiv reaDer
実画像のローカライズされたスタイル編集のメカニズムとしてのマスクガイド機能変調の有効性の調査
Exploring the Effectiveness of Mask-Guided Feature Modulation as a Mechanism for Localized Style Editing of Real Images
高解像度画像生成におけるディープ ジェネレーティブ モデルの成功により、実際の画像のスタイル編集に広く利用されるようになりました。ほとんどの既存の方法は、実際の画像を潜在空間に反転し、その後に制御可能な方向を決定するという原則に基づいています。実像の反転と制御可能な潜在方向の決定は、どちらも計算コストの高い操作です。さらに、制御可能な潜在的な方向の決定には、追加の人間の監督が必要です。この作業は、これらのボトルネックの解決策として、ディープ ジェネレーティブ モデルの潜在空間におけるマスク ガイド付き機能変調の有効性を調査することを目的としています。この目的のために、SemanticStyle Autoencoder (SSAE) を提示します。これは、実際の画像の高度にローカライズされたフォトリアリスティックなスタイルの編集のために、セマンティック マスク ガイドによる潜在空間操作を活用する深いジェネレーティブ オートエンコーダー モデルです。同じものとその分析の定性的および定量的な結果を提示します。この作業は、今後の作業の指針となるものです。
The success of Deep Generative Models at high-resolution image generation has led to their extensive utilization for style editing of real images. Most existing methods work on the principle of inverting real images onto their latent space, followed by determining controllable directions. Both inversion of real images and determination of controllable latent directions are computationally expensive operations. Moreover, the determination of controllable latent directions requires additional human supervision. This work aims to explore the efficacy of mask-guided feature modulation in the latent space of a Deep Generative Model as a solution to these bottlenecks. To this end, we present the SemanticStyle Autoencoder (SSAE), a deep Generative Autoencoder model that leverages semantic mask-guided latent space manipulation for highly localized photorealistic style editing of real images. We present qualitative and quantitative results for the same and their analysis. This work shall serve as a guiding primer for future work.
updated: Mon Nov 21 2022 07:36:20 GMT+0000 (UTC)
published: Mon Nov 21 2022 07:36:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト