arXiv reaDer
逆熱放散によるジェネレーティブ モデリング
Generative Modelling With Inverse Heat Dissipation
拡散モデルは画像生成において大きな成功を収めていますが、それらのノイズ反転生成プロセスは、固有のマルチスケールの性質など、画像の構造を明示的に考慮していません。拡散モデルと粗から微細へのモデリングの経験的な成功に触発されて、熱方程式を繰り返し逆にすることで画像を生成する新しいモデルを提案します。これは、画像の 2D 平面上で実行されると、細かいスケールの情報を局所的に消去する PDE です。前方熱方程式のノイズ緩和解を、拡散のような潜在変数モデルの変分近似として解釈します。私たちの新しいモデルは、画像の全体的な色と形状のもつれの解消やデータ効率など、標準的な拡散モデルには見られない新たな質的特性を示しています。自然画像のスペクトル分析は、拡散モデルへの接続を強調し、それらの暗黙の誘導バイアスを明らかにします。
While diffusion models have shown great success in image generation, their noise-inverting generative process does not explicitly consider the structure of images, such as their inherent multi-scale nature. Inspired by diffusion models and the empirical success of coarse-to-fine modelling, we propose a new model that generates images through iteratively inverting the heat equation, a PDE that locally erases fine-scale information when run over the 2D plane of the image. We interpret a noise-relaxed solution of the forward heat equation as a variational approximation in a diffusion-like latent variable model. Our new model shows emergent qualitative properties not seen in standard diffusion models, such as disentanglement of overall colour and shape in images and data efficiency. Spectral analysis on natural images highlights connections to diffusion models and reveals implicit inductive biases in them.
updated: Sun Nov 20 2022 11:30:01 GMT+0000 (UTC)
published: Tue Jun 21 2022 13:40:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト