arXiv reaDer
統一された画像の復元と強化のための生成的拡散優先
Generative Diffusion Prior for Unified Image Restoration and Enhancement
既存の画像復元方法は、主に自然画像の事後分布を利用しています。ただし、それらは多くの場合、既知の劣化を想定しており、教師付きのトレーニングも必要とするため、複雑な実際のアプリケーションへの適応が制限されます。この作業では、教師なしサンプリング方法で事後分布を効果的にモデル化するために生成拡散事前分布 (GDP) を提案します。 GDP は、線形逆、非線形、またはブラインドの問題を解決するために、トレーニング前のノイズ除去拡散生成モデル (DDPM) を利用します。具体的には、GDP は条件付きガイダンスのプロトコルを体系的に調査します。これは、一般的に使用されるガイダンス方法よりも実用的であることが検証されています。さらに、GDPは、ノイズ除去プロセス中に劣化モデルのパラメーターを最適化することに強みがあり、ブラインド画像の復元を実現します。さらに、階層的なガイダンスとパッチベースの方法を考案し、GDP が任意の解像度の画像を生成できるようにします。実験的に、超解像度、ブレ除去、修復、カラー化などの線形問題、および低照度強調や HDR 画像回復などの非線形およびブラインドの問題について、いくつかの画像データセットで GDP の汎用性を示します。 GDP は、再構成の質と知覚の質のさまざまなベンチマークで、現在の主要な教師なし手法よりも優れています。さらに、GDP は、ImageNet トレーニング セットの分布のうち、さまざまなタスクからの任意のサイズの自然画像または合成画像に対してもよく一般化されます。
Existing image restoration methods mostly leverage the posterior distribution of natural images. However, they often assume known degradation and also require supervised training, which restricts their adaptation to complex real applications. In this work, we propose the Generative Diffusion Prior (GDP) to effectively model the posterior distributions in an unsupervised sampling manner. GDP utilizes a pre-train denoising diffusion generative model (DDPM) for solving linear inverse, non-linear, or blind problems. Specifically, GDP systematically explores a protocol of conditional guidance, which is verified more practical than the commonly used guidance way. Furthermore, GDP is strength at optimizing the parameters of degradation model during the denoising process, achieving blind image restoration. Besides, we devise hierarchical guidance and patch-based methods, enabling the GDP to generate images of arbitrary resolutions. Experimentally, we demonstrate GDP's versatility on several image datasets for linear problems, such as super-resolution, deblurring, inpainting, and colorization, as well as non-linear and blind issues, such as low-light enhancement and HDR image recovery. GDP outperforms the current leading unsupervised methods on the diverse benchmarks in reconstruction quality and perceptual quality. Moreover, GDP also generalizes well for natural images or synthesized images with arbitrary sizes from various tasks out of the distribution of the ImageNet training set.
updated: Mon Apr 03 2023 16:52:43 GMT+0000 (UTC)
published: Mon Apr 03 2023 16:52:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト