arXiv reaDer
拡散確率場
Diffusion Probabilistic Fields
拡散確率モデルは、画像、3D ジオメトリ、ビデオ、およびその他のドメインの生成モデリングの主要なアプローチになりました。ただし、拡散生成モデリングをこれらのドメインに適応させるには、多くの場合、データがユークリッド グリッドに存在するという仮定の下で、ノイズ除去ネットワークをドメインごとに個別に慎重に設計する必要があります。このホワイト ペーパーでは、拡散確率場 (DPF) を紹介します。これは、一般に場として知られる距離空間で定義された連続関数の分布を学習できる拡散モデルです。拡散確率モデルの定式化を拡張して、このフィールドのパラメーター化を明示的な方法で処理し、以前のアプローチのように潜在ベクトルでフィールドを表すという要件を回避するエンドツーエンドの学習アルゴリズムを定義できるようにします (Dupont et al., 2022a; Du et al., 2021)。同じノイズ除去ネットワークを使用しながら、非ユークリッド距離空間で定義されたフィールドの分布をモデル化することに加えて、DPF が 2D 画像や 3D ジオメトリなどのさまざまなモダリティを効果的に処理することを経験的に示しています。
Diffusion probabilistic models have quickly become a major approach for generative modeling of images, 3D geometry, video and other domains. However, to adapt diffusion generative modeling to these domains the denoising network needs to be carefully designed for each domain independently, oftentimes under the assumption that data lives in a Euclidean grid. In this paper we introduce Diffusion Probabilistic Fields (DPF), a diffusion model that can learn distributions over continuous functions defined over metric spaces, commonly known as fields. We extend the formulation of diffusion probabilistic models to deal with this field parametrization in an explicit way, enabling us to define an end-to-end learning algorithm that side-steps the requirement of representing fields with latent vectors as in previous approaches (Dupont et al., 2022a; Du et al., 2021). We empirically show that, while using the same denoising network, DPF effectively deals with different modalities like 2D images and 3D geometry, in addition to modeling distributions over fields defined on non-Euclidean metric spaces.
updated: Wed Mar 01 2023 01:37:24 GMT+0000 (UTC)
published: Wed Mar 01 2023 01:37:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト