arXiv reaDer
リアルな画像復元トレーニング ペアの合成: 拡散アプローチ
Synthesizing Realistic Image Restoration Training Pairs: A Diffusion Approach
教師あり画像復元タスクにおける重要な問題の 1 つは、位置合わせされた高品質 (HQ) と低品質 (LQ) のトレーニング画像のペアを取得する方法です。残念ながら、このような HQ-LQ トレーニング ペアは、実際に取得するのが難しく、実際には未知の複雑な劣化が原因で合成するのが困難です。いくつかの洗練された劣化モデルは、対応する HQ から LQ 画像を合成するために手動で設計されていますが、合成された LQ 画像と実際の LQ 画像の間の分布ギャップは依然として大きいままです。新しいノイズ除去拡散確率モデル (DDPM) を使用して、リアルな画像復元トレーニング ペアを合成する新しいアプローチを提案します。まず、ノイズの多い入力を目的の LQ 画像に変換できる DDPM を、収集された大量の LQ 画像を使用してトレーニングします。これにより、ターゲット データの分布が定義されます。次に、特定の HQ 画像に対して、既製の劣化モデルを使用して初期 LQ 画像を合成し、それに適切なガウス ノイズを繰り返し追加します。最後に、事前トレーニング済みの DDPM を使用してノイズの多い LQ 画像のノイズを除去し、現実世界の LQ 画像のターゲット分布に該当する最終的な LQ 画像を取得します。分布近似における DDPM の強力な機能のおかげで、合成された HQ-LQ 画像ペアを使用して、ブラインド顔画像復元やブラインド画像超解像などの現実世界の画像復元タスク用の堅牢なモデルをトレーニングできます。実験は、既存の劣化モデルに対する提案されたアプローチの優位性を実証しました。コードとデータが公開されます。
In supervised image restoration tasks, one key issue is how to obtain the aligned high-quality (HQ) and low-quality (LQ) training image pairs. Unfortunately, such HQ-LQ training pairs are hard to capture in practice, and hard to synthesize due to the complex unknown degradation in the wild. While several sophisticated degradation models have been manually designed to synthesize LQ images from their HQ counterparts, the distribution gap between the synthesized and real-world LQ images remains large. We propose a new approach to synthesizing realistic image restoration training pairs using the emerging denoising diffusion probabilistic model (DDPM). First, we train a DDPM, which could convert a noisy input into the desired LQ image, with a large amount of collected LQ images, which define the target data distribution. Then, for a given HQ image, we synthesize an initial LQ image by using an off-the-shelf degradation model, and iteratively add proper Gaussian noises to it. Finally, we denoise the noisy LQ image using the pre-trained DDPM to obtain the final LQ image, which falls into the target distribution of real-world LQ images. Thanks to the strong capability of DDPM in distribution approximation, the synthesized HQ-LQ image pairs can be used to train robust models for real-world image restoration tasks, such as blind face image restoration and blind image super-resolution. Experiments demonstrated the superiority of our proposed approach to existing degradation models. Code and data will be released.
updated: Mon Mar 13 2023 10:49:59 GMT+0000 (UTC)
published: Mon Mar 13 2023 10:49:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト