arXiv reaDer
拡散モデルにはすでにセマンティック潜在空間があります
Diffusion Models already have a Semantic Latent Space
拡散モデルは、さまざまな領域で優れた生成性能を発揮します。大成功を収めたにもかかわらず、生成プロセスを制御するために不可欠な意味的潜在空間が欠けています。この問題に対処するために、凍結された事前訓練された拡散モデルでセマンティック潜在空間を発見する非対称逆プロセス (Asyrp) を提案します。 h-space と名付けられた私たちのセマンティック潜在空間には、セマンティック イメージ操作に対応するための優れた特性があります。つまり、均一性、線形性、ロバスト性、およびタイム ステップ全体での一貫性です。さらに、多目的な編集と定量化可能な尺度による品質向上のための生成プロセスの原則的な設計を紹介します。時間ステップでの間隔の編集強度と品質不足です。私たちの方法は、さまざまなアーキテクチャ (DDPM++、iD-DPM、および ADM) とデータセット (CelebA-HQ、AFHQ-dog、LSUN-church、LSUN-bedroom、METFACES) に適用できます。プロジェクトページ:https://kwonminki.github.io/Asyrp/
Diffusion models achieve outstanding generative performance in various domains. Despite their great success, they lack semantic latent space which is essential for controlling the generative process. To address the problem, we propose asymmetric reverse process (Asyrp) which discovers the semantic latent space in frozen pretrained diffusion models. Our semantic latent space, named h-space, has nice properties for accommodating semantic image manipulation: homogeneity, linearity, robustness, and consistency across timesteps. In addition, we introduce a principled design of the generative process for versatile editing and quality boost ing by quantifiable measures: editing strength of an interval and quality deficiency at a timestep. Our method is applicable to various architectures (DDPM++, iD- DPM, and ADM) and datasets (CelebA-HQ, AFHQ-dog, LSUN-church, LSUN- bedroom, and METFACES). Project page: https://kwonminki.github.io/Asyrp/
updated: Wed Mar 29 2023 06:39:50 GMT+0000 (UTC)
published: Thu Oct 20 2022 02:07:23 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト