arXiv reaDer
粗いイメージから細かいイメージへの合成のための拡散モデルのプログレッシブ ブレ除去
Progressive Deblurring of Diffusion Models for Coarse-to-Fine Image Synthesis
最近、拡散モデルは、ノイズを徐々に除去し、信号を増幅することにより、画像合成において顕著な結果を示しています。単純な生成プロセスは驚くほどうまく機能しますが、これは画像データを生成する最良の方法ですか?たとえば、人間の知覚は画像の低周波数に対してより敏感であるという事実にもかかわらず、拡散モデル自体は各周波数成分の相対的な重要性を考慮していません。したがって、画像データの誘導バイアスを組み込むために、粗から細かい方法で画像を合成する新しい生成プロセスを提案します。まず、ベクトルの各成分に対して異なる速度を持つ回転座標系で拡散を有効にすることにより、標準拡散モデルを一般化します。さらに、画像の各周波数成分が異なる速度で拡散される特殊なケースとして、ぼかし拡散を提案します。具体的には、提案されたぼかし拡散は、画像をぼかしてノイズを徐々に追加する順方向プロセスで構成され、その後、対応する逆方向プロセスが画像のブレを除去し、ノイズを徐々に除去します。実験は、提案されたモデルが、LSUN の寝室と教会のデータセットに対する FID の以前の方法よりも優れていることを示しています。コードは https://github.com/sangyun884/blur-diffusion で入手できます。
Recently, diffusion models have shown remarkable results in image synthesis by gradually removing noise and amplifying signals. Although the simple generative process surprisingly works well, is this the best way to generate image data? For instance, despite the fact that human perception is more sensitive to the low frequencies of an image, diffusion models themselves do not consider any relative importance of each frequency component. Therefore, to incorporate the inductive bias for image data, we propose a novel generative process that synthesizes images in a coarse-to-fine manner. First, we generalize the standard diffusion models by enabling diffusion in a rotated coordinate system with different velocities for each component of the vector. We further propose a blur diffusion as a special case, where each frequency component of an image is diffused at different speeds. Specifically, the proposed blur diffusion consists of a forward process that blurs an image and adds noise gradually, after which a corresponding reverse process deblurs an image and removes noise progressively. Experiments show that the proposed model outperforms the previous method in FID on LSUN bedroom and church datasets. Code is available at https://github.com/sangyun884/blur-diffusion.
updated: Mon Nov 21 2022 12:44:45 GMT+0000 (UTC)
published: Sat Jul 16 2022 15:00:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト