arXiv reaDer
ILVR:拡散確率モデルのノイズ除去のためのコンディショニング方法
ILVR: Conditioning Method for Denoising Diffusion Probabilistic Models
ノイズ除去拡散確率モデル(DDPM)は、無条件の画像生成で優れたパフォーマンスを示しています。ただし、DDPMの生成プロセスは確率論的であるため、目的のセマンティクスで画像を生成することは困難です。この作業では、与えられた参照画像に基づいて高品質の画像を生成するためにDDPMの生成プロセスをガイドする方法である反復潜在変数リファインメント(ILVR)を提案します。ここで、DDPMの生成プロセスの改良により、単一のDDPMが参照画像によって指示されたさまざまなセットから画像をサンプリングできるようになります。提案されたILVR法は、生成を制御しながら高品質の画像を生成します。私たちの方法の可制御性により、さまざまなダウンサンプリングファクターからの生成、マルチドメイン画像変換、ペイントから画像への編集、落書きによる編集など、さまざまな画像生成タスクで追加の学習を行うことなく、単一のDDPMを適応させることができます。
Denoising diffusion probabilistic models (DDPM) have shown remarkable performance in unconditional image generation. However, due to the stochasticity of the generative process in DDPM, it is challenging to generate images with the desired semantics. In this work, we propose Iterative Latent Variable Refinement (ILVR), a method to guide the generative process in DDPM to generate high-quality images based on a given reference image. Here, the refinement of the generative process in DDPM enables a single DDPM to sample images from various sets directed by the reference image. The proposed ILVR method generates high-quality images while controlling the generation. The controllability of our method allows adaptation of a single DDPM without any additional learning in various image generation tasks, such as generation from various downsampling factors, multi-domain image translation, paint-to-image, and editing with scribbles.
updated: Fri Aug 06 2021 04:43:13 GMT+0000 (UTC)
published: Fri Aug 06 2021 04:43:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト