arXiv reaDer
逆熱放散を伴う生成モデリング
Generative Modelling With Inverse Heat Dissipation
拡散モデルは画像生成で大きな成功を収めていますが、ノイズ反転生成プロセスでは、固有のマルチスケールの性質など、画像の構造を明示的に考慮していません。拡散モデルと粗いモデリングから細かいモデリングの望ましさに触発されて、熱方程式を繰り返し反転することによって画像を生成する新しいモデルを提案します。これは、画像の2D平面上を実行すると細かいスケールの情報を局所的に消去するPDEです。私たちの新しい方法論では、順方向熱方程式の解は、有向グラフィカルモデルの変分近似として解釈されます。有望な画質を示し、画像の全体的な色と形状の解きほぐしやニューラルネットワークの解釈可能性の側面など、拡散モデルには見られない新たな質的特性を指摘します。自然画像のスペクトル分析は、私たちのモデルを拡散モデルの一種として位置付け、それらの暗黙の誘導バイアスを明らかにします。
While diffusion models have shown great success in image generation, their noise-inverting generative process does not explicitly consider the structure of images, such as their inherent multi-scale nature. Inspired by diffusion models and the desirability of coarse-to-fine modelling, we propose a new model that generates images through iteratively inverting the heat equation, a PDE that locally erases fine-scale information when run over the 2D plane of the image. In our novel methodology, the solution of the forward heat equation is interpreted as a variational approximation in a directed graphical model. We demonstrate promising image quality and point out emergent qualitative properties not seen in diffusion models, such as disentanglement of overall colour and shape in images and aspects of neural network interpretability. Spectral analysis on natural images positions our model as a type of dual to diffusion models and reveals implicit inductive biases in them.
updated: Wed Jul 27 2022 19:34:02 GMT+0000 (UTC)
published: Tue Jun 21 2022 13:40:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト