最近、与えられた低解像度画像に対して複数の可能な再構成が存在するという超解像の不適切な性質についての議論がありました。 SRflow [23]は、正規化フローを使用して、1つの推定値に対する決定論的出力ではなく、出力の分布を学習することにより、最先端の知覚品質を実現します。このホワイトペーパーでは、SRFlowの概念を適応させて、1対多のプロパティを適切に実装することでGANベースの超解像を改善します。ジェネレータを変更して、ランダムノイズからのマッピングとして分布を推定します。知覚トレーニングの目的を妨げるコンテンツの損失を改善します。また、生成された画像の知覚品質をさらに向上させるための追加のトレーニング手法を提案します。提案された方法を使用して、RFB-ESRGAN [21]に方法を適用することにより、x4知覚SRでESRGAN [1]のパフォーマンスを改善し、x16知覚極度SRで最先端のLPIPSスコアを達成することができました。
Recently, there has been discussions on the ill-posed nature of super-resolution that multiple possible reconstructions exist for a given low-resolution image. Using normalizing flows, SRflow[23] achieves state-of-the-art perceptual quality by learning the distribution of the output instead of a deterministic output to one estimate. In this paper, we adapt the concepts of SRFlow to improve GAN-based super-resolution by properly implementing the one-to-many property. We modify the generator to estimate a distribution as a mapping from random noise. We improve the content loss that hampers the perceptual training objectives. We also propose additional training techniques to further enhance the perceptual quality of generated images. Using our proposed methods, we were able to improve the performance of ESRGAN[1] in x4 perceptual SR and achieve the state-of-the-art LPIPS score in x16 perceptual extreme SR by applying our methods to RFB-ESRGAN[21].