arXiv reaDer
ハードデータの一貫性による潜在拡散モデルの逆問題の解決
Solving Inverse Problems with Latent Diffusion Models via Hard Data Consistency
拡散モデルは、逆問題を解決するための強力な生成事前分布として最近登場しました。ただし、ピクセル空間での拡散モデルのトレーニングは大量のデータを必要とし、計算量も多く要求されるため、医療画像などの領域での事前分布モデルとしての適用性が制限されます。潜在拡散モデルは、はるかに低次元の空間で動作し、これらの課題に対する解決策を提供します。ただし、エンコーダとデコーダの非線形性により、逆問題の解決への直接の適用は未解決の技術的課題のままです。この問題に対処するために、事前に訓練された潜在拡散モデルを使用して一般逆問題を解決するアルゴリズムである ReSample を提案します。私たちのアルゴリズムには、逆サンプリング プロセス中に最適化問題を解決することによってデータの一貫性が組み込まれており、これをハード データの一貫性と呼ぶ概念です。この最適化問題を解決する際に、測定に一貫性のあるサンプルを正しいデータ多様体にマップし直すための新しいリサンプリング スキームを提案します。私たちのアプローチは、(1) トレーニング中に固定のフォワード測定演算子を仮定しないため、同じ事前トレーニングされたモデルを使用してさまざまな逆問題に容易に適応できるという意味で、メモリ効率とかなりの柔軟性の両方を提供します。最小限のデータサンプルで潜在拡散モデルを微調整するだけで、さまざまなドメインに一般化できます。線形および非線形逆問題の両方に関する私たちの経験的結果は、私たちのアプローチがピクセル空間で動作する最先端の作品と比較しても高品質の画像を再構築できることを示しています。
Diffusion models have recently emerged as powerful generative priors for solving inverse problems. However, training diffusion models in the pixel space are both data intensive and computationally demanding, which restricts their applicability as priors in domains such as medical imaging. Latent diffusion models, which operate in a much lower-dimensional space, offer a solution to these challenges. Though, their direct application to solving inverse problems remains an unsolved technical challenge due to the nonlinearity of the encoder and decoder. To address this issue,we propose ReSample, an algorithm that solves general inverse problems with pre-trained latent diffusion models. Our algorithm incorporates data consistency by solving an optimization problem during the reverse sampling process, a concept that we term as hard data consistency. Upon solving this optimization problem, we propose a novel resampling scheme to map the measurement-consistent sample back onto the correct data manifold. Our approach offers both memory efficiency and considerable flexibility in the sense that (1) it can be readily adapted to various inverse problems using the same pre-trained model as it does not assume any fixed forward measurement operator during training, and (2) it can be generalized to different domains by simply fine-tuning the latent diffusion model with a minimal amount of data samples. Our empirical results on both linear and non-linear inverse problems demonstrate that our approach can reconstruct high-quality images even compared to state-of-the-art works that operate in the pixel space.
updated: Sun Jul 16 2023 18:42:01 GMT+0000 (UTC)
published: Sun Jul 16 2023 18:42:01 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト