arXiv reaDer
逆熱放散によるジェネレーティブ モデリング
Generative Modelling With Inverse Heat Dissipation
拡散モデルは画像生成において大きな成功を収めていますが、それらのノイズ反転生成プロセスは、固有のマルチスケールの性質など、画像の構造を明示的に考慮していません。拡散モデルと粗から細へのモデリングの望ましさに着想を得て、熱方程式を繰り返し逆にすることで画像を生成する新しいモデルを提案します。これは、画像の 2D 平面上で実行されると、細かいスケールの情報を局所的に消去する PDE です。前方熱方程式の解を、拡散のような潜在変数モデルの変分近似として解釈します。画像の全体的な色と形状のもつれの解消、ニューラル ネットワークの解釈可能性の側面など、拡散モデルには見られない緊急の質的特性を指摘します。自然画像のスペクトル分析は、拡散モデルへの接続を解明し、それらの暗黙の誘導バイアスを明らかにします。
While diffusion models have shown great success in image generation, their noise-inverting generative process does not explicitly consider the structure of images, such as their inherent multi-scale nature. Inspired by diffusion models and the desirability of coarse-to-fine modelling, we propose a new model that generates images through iteratively inverting the heat equation, a PDE that locally erases fine-scale information when run over the 2D plane of the image. We interpret the solution of the forward heat equation as a variational approximation in a diffusion-like latent variable model. We point out emergent qualitative properties not seen in diffusion models, such as disentanglement of overall colour and shape in images and aspects of neural network interpretability. Spectral analysis on natural images elucidates connections to diffusion models and reveals implicit inductive biases in them.
updated: Tue Sep 20 2022 22:45:15 GMT+0000 (UTC)
published: Tue Jun 21 2022 13:40:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト