arXiv reaDer
Variational Diffusion Auto-encoder: 無条件拡散事前分布を持つ深層潜在変数モデル
Variational Diffusion Auto-encoder: Deep Latent Variable Model with Unconditional Diffusion Prior
変分自動エンコーダー (VAE) は、深い生成モデリングへの最も一般的なアプローチの 1 つです。その成功にもかかわらず、VAE によって生成された画像は、条件付きデータ分布 p(x | z) を等方性ガウス分布として近似できるという非常に非現実的なモデリングの仮定により、ぼやけに悩まされることが知られています。この作業では、拡散モデルを組み込むことにより、条件付きデータ分布 p(x | z) をモデル化するための原則的なアプローチを紹介します。 p(x | z) に関するガウス仮定を作成したり、デコーダー ネットワークをトレーニングしたりすることなく、VAE のような深層潜在変数モデルを作成できることを示します。訓練されたエンコーダーと無条件の拡散モデルは、スコア関数のベイズ規則を介して組み合わせることができ、 p(x | z) の表現力豊かなモデルを取得できます。私たちのアプローチは、 p(x | z) のパラメトリック形式で強い仮定を行うことを回避するため、VAE のパフォーマンスを大幅に向上させることができます。
Variational auto-encoders (VAEs) are one of the most popular approaches to deep generative modeling. Despite their success, images generated by VAEs are known to suffer from blurriness, due to a highly unrealistic modeling assumption that the conditional data distribution p(x | z) can be approximated as an isotropic Gaussian. In this work we introduce a principled approach to modeling the conditional data distribution p(x | z) by incorporating a diffusion model. We show that it is possible to create a VAE-like deep latent variable model without making the Gaussian assumption on p(x | z) or even training a decoder network. A trained encoder and an unconditional diffusion model can be combined via Bayes' rule for score functions to obtain an expressive model for p(x | z) . Our approach avoids making strong assumptions on the parametric form of p(x | z) , and thus allows to significantly improve the performance of VAEs.
updated: Mon Apr 24 2023 14:44:47 GMT+0000 (UTC)
published: Mon Apr 24 2023 14:44:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト