arXiv reaDer
画像のブレ除去のためのマルチスケール構造誘導拡散
Multiscale Structure Guided Diffusion for Image Deblurring
拡散確率モデル (DPM) は、画像のブレ除去に最近採用されており、ガウス ノイズを高品質の画像にマッピングする画像調整された生成プロセスとして定式化され、ぼやけた入力を条件としています。画像調整された DPM (icDPM) は、ペアワイズ インドメイン データでトレーニングされた場合、回帰ベースの方法よりも現実的な結果を示しています。ただし、特定の劣化モデルや中間の制約を課さないため、ドメイン外の画像を提示した場合、画像を復元する際の堅牢性は不明です。この目的のために、中間層でのシャープな画像の粗い構造についてicDPMに通知する暗黙のバイアスとして、シンプルで効果的なマルチスケール構造ガイダンスを導入します。このガイド付き定式化により、特に目に見えないドメインで、ブレ除去の結果が大幅に改善されます。ガイダンスは、複数の低解像度で鮮明なターゲットを予測するようにトレーニングされた回帰ネットワークの潜在空間から抽出されるため、最も顕著な鮮明な構造が維持されます。ぼやけた入力とマルチスケール ガイダンスの両方を使用して、icDPM モデルはぼやけをよりよく理解し、きれいな画像を復元できます。さまざまなデータセットで単一データセットのトレーニング済みモデルを評価し、目に見えないデータのアーティファクトが少なく、より堅牢なブレ除去結果を示します。私たちの方法は既存のベースラインよりも優れており、競争力のある歪み指標を維持しながら最先端の知覚品質を達成しています。
Diffusion Probabilistic Models (DPMs) have recently been employed for image deblurring, formulated as an image-conditioned generation process that maps Gaussian noise to the high-quality image, conditioned on the blurry input. Image-conditioned DPMs (icDPMs) have shown more realistic results than regression-based methods when trained on pairwise in-domain data. However, their robustness in restoring images is unclear when presented with out-of-domain images as they do not impose specific degradation models or intermediate constraints. To this end, we introduce a simple yet effective multiscale structure guidance as an implicit bias that informs the icDPM about the coarse structure of the sharp image at the intermediate layers. This guided formulation leads to a significant improvement of the deblurring results, particularly on unseen domain. The guidance is extracted from the latent space of a regression network trained to predict the clean-sharp target at multiple lower resolutions, thus maintaining the most salient sharp structures. With both the blurry input and multiscale guidance, the icDPM model can better understand the blur and recover the clean image. We evaluate a single-dataset trained model on diverse datasets and demonstrate more robust deblurring results with fewer artifacts on unseen data. Our method outperforms existing baselines, achieving state-of-the-art perceptual quality while keeping competitive distortion metrics.
updated: Mon Mar 20 2023 02:34:51 GMT+0000 (UTC)
published: Sun Dec 04 2022 10:40:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト