Perception-oriented Single Image Super-Resolution via Dual Relativistic Average Generative Adversarial Networks
 画像の超解像(SR)の開発を大いに促進する残留および高密度ニューラルネットワークの存在は、多くの印象的な結果を目撃しました。観測に応じて、より多くのレイヤーと接続が常にパフォーマンスを向上させる可能性がありますが、モデルパラメーターの増加はSRアルゴリズムのアプリケーションを起動するのに役立ちません。さらに、L1 / L2損失によって監視されるアルゴリズムは、PSNRやSSIMなどの従来のメトリックでかなりのパフォーマンスを達成できますが、十分な高周波の詳細、つまり低知覚インデックス(PI)がなく、ぼやけて過度に滑らかな出力になります。問題に関して、この論文は、二重相対論的平均生成的敵対ネットワークを介して知覚指向の単一画像SRアルゴリズムを開発する。ジェネレーター部分では、特定のチャネルの重要性を再調整し、特徴表現機能をさらに向上させるために、新しい残留チャネルアテンションブロックが提案されています。各ブロック内の畳み込み層のパラメーターは、調整可能なパラメーターの量を変更せずに維持しながら受容フィールドを拡大するために共有されます。特徴マップは、再構成された高解像度画像を取得するために、サブピクセル畳み込みを使用してサブサンプリングされます。弁別器部分は、ピクセル領域と機能領域でそれぞれ動作する2つの相対論的平均弁別器で構成され、ミニバッチのデータの半分が偽物であるという以前の状況を完全に活用します。知覚的損失と敵対的損失のさまざまな重み付き組み合わせを使用して、ジェネレータを監視し、知覚的品質と客観的結果を平衡化します。実験結果とアブレーション研究により、提案されたアルゴリズムは、知覚的(PI最小化)と客観的(PSNR最大化)の両方で、より少ないパラメーターで最先端のSRアルゴリズムに匹敵することが示されています。
The presence of residual and dense neural networks which greatly promotes the development of image Super-Resolution(SR) have witnessed a lot of impressive results. Depending on our observation, although more layers and connections could always improve performance, the increase of model parameters is not conducive to launch application of SR algorithms. Furthermore, algorithms supervised by L1/L2 loss can achieve considerable performance on traditional metrics such as PSNR and SSIM, yet resulting in blurry and over-smoothed outputs without sufficient high-frequency details, namely low perceptual index(PI). Regarding the issues, this paper develops a perception-oriented single image SR algorithm via dual relativistic average generative adversarial networks. In the generator part, a novel residual channel attention block is proposed to recalibrate significance of specific channels, further increasing feature expression capabilities. Parameters of convolutional layers within each block are shared to expand receptive fields while maintain the amount of tunable parameters unchanged. The feature maps are subsampled using sub-pixel convolution to obtain reconstructed high-resolution images. The discriminator part consists of two relativistic average discriminators that work in pixel domain and feature domain, respectively, fully exploiting the prior that half of data in a mini-batch are fake. Different weighted combinations of perceptual loss and adversarial loss are utilized to supervise the generator to equilibrate perceptual quality and objective results. Experimental results and ablation studies show that our proposed algorithm can rival state-of-the-art SR algorithms, both perceptually(PI-minimization) and objectively(PSNR-maximization) with fewer parameters.
updated: Thu Feb 20 2020 06:34:58 GMT+0000 (UTC)
published: Fri Nov 08 2019 11:09:43 GMT+0000 (UTC)
