最近、ディープニューラルネットワークが単一画像超解像(SISR)のパフォーマンスを大幅に改善できることが示されています。多くの研究が、超解像(SR)画像の定量的な品質を高めることに集中しています。ただし、PSNRの最大化を対象とするこれらの方法では、通常、大きなアップスケーリング係数でぼやけた画像が生成されます。生成的敵対的ネットワーク(GAN)の導入により、この問題を軽減し、合成高周波テクスチャで印象的な結果を示すことができます。それにもかかわらず、これらのGANベースのアプローチには、偽のテクスチャやアーティファクトさえも追加して、視覚的に高解像度のSR画像を作成する傾向があります。本稿では、段階的なネットワークを構築することにより、視覚的に高品質な結果を徐々に生成する新しい知覚画像超解像法を提案します。具体的には、最初のフェーズはピクセル単位のエラーの最小化に集中し、2番目のステージは前のステージで抽出された機能を利用して、より優れた構造保持の結果を追求します。最終段階では、第2フェーズで抽出された微細構造機能を使用して、より現実的な結果を生成します。このようにして、知覚画像のピクセルと構造レベルの情報を可能な限り維持することができます。提案された方法は、フィードフォワードプロセスで3種類の画像を作成できることに注意してください。また、マルチスケールの階層的特徴の融合を採用した新しいジェネレーターを探索します。ベンチマークデータセットでの広範囲な実験は、私たちのアプローチが最先端の方法よりも優れていることを示しています。コードはhttps://github.com/Zheng222/PPONで入手できます。
Recently, it has been demonstrated that deep neural networks can significantly improve the performance of single image super-resolution (SISR). Numerous studies have concentrated on raising the quantitative quality of super-resolved (SR) images. However, these methods that target PSNR maximization usually produce blurred images at large upscaling factor. The introduction of generative adversarial networks (GANs) can mitigate this issue and show impressive results with synthetic high-frequency textures. Nevertheless, these GAN-based approaches always have a tendency to add fake textures and even artifacts to make the SR image of visually higher-resolution. In this paper, we propose a novel perceptual image super-resolution method that progressively generates visually high-quality results by constructing a stage-wise network. Specifically, the first phase concentrates on minimizing pixel-wise error, and the second stage utilizes the features extracted by the previous stage to pursue results with better structural retention. The final stage employs fine structure features distilled by the second phase to produce more realistic results. In this way, we can maintain the pixel, and structural level information in the perceptual image as much as possible. It is useful to note that the proposed method can build three types of images in a feed-forward process. Also, we explore a new generator that adopts multi-scale hierarchical features fusion. Extensive experiments on benchmark datasets show that our approach is superior to the state-of-the-art methods. Code is available at https://github.com/Zheng222/PPON.