arXiv reaDer
反復リファインメントによる画像の超解像
Image Super-Resolution via Iterative Refinement
繰り返しリファインメントによる超解像を画像化するアプローチであるSR3を紹介します。 SR3は、ノイズ除去拡散確率モデルを条件付き画像生成に適合させ、確率的ノイズ除去プロセスを通じて超解像を実行します。推論は純粋なガウスノイズから始まり、さまざまなノイズレベルでのノイズ除去についてトレーニングされたU-Netモデルを使用して、ノイズの多い出力を繰り返し改良します。 SR3は、顔や自然画像など、さまざまな倍率での超解像タスクで強力なパフォーマンスを発揮します。私たちは、CelebA-HQの標準的な8X顔超解像タスクで、SOTAGANメソッドと比較して人間による評価を行います。 SR3は50%に近いフール率を達成し、フォトリアリスティックな出力を示唆しますが、GANは34%のフール率を超えません。さらに、カスケード画像生成におけるSR3の有効性を示します。ここでは、生成モデルが超解像モデルとチェーンされ、ImageNetで11.3の競争力のあるFIDスコアが得られます。
We present SR3, an approach to image Super-Resolution via Repeated Refinement. SR3 adapts denoising diffusion probabilistic models to conditional image generation and performs super-resolution through a stochastic denoising process. Inference starts with pure Gaussian noise and iteratively refines the noisy output using a U-Net model trained on denoising at various noise levels. SR3 exhibits strong performance on super-resolution tasks at different magnification factors, on faces and natural images. We conduct human evaluation on a standard 8X face super-resolution task on CelebA-HQ, comparing with SOTA GAN methods. SR3 achieves a fool rate close to 50%, suggesting photo-realistic outputs, while GANs do not exceed a fool rate of 34%. We further show the effectiveness of SR3 in cascaded image generation, where generative models are chained with super-resolution models, yielding a competitive FID score of 11.3 on ImageNet.
updated: Thu Apr 15 2021 17:50:42 GMT+0000 (UTC)
published: Thu Apr 15 2021 17:50:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト