arXiv reaDer
敵対的学習のための品質マップ融合
Quality Map Fusion for Adversarial Learning
人間の視覚系(HVS)と相関して視覚情報を伝達する顕著な低レベルの特徴をキャプチャする生成的敵対的モデルは、依然として知覚可能な画像劣化に悩まされています。このような非常に有益な機能を伝えることができないのは、モードの崩壊、収束の失敗、勾配消失に起因する可能性があります。この論文では、HVSと同様の画像特徴と深層畳み込みニューラルネットワーク(DCNN)の知覚特性を利用する新しい品質マップ融合手法を導入することにより、逆に画質を改善します。広く採用されているl2ワッサースタイン距離計量を、構造、輝度、コントラスト、画像の自然さなど、より豊かな画像プロパティをキャプチャするバナッハ空間から派生した他の好ましい品質基準に拡張します。また、ネットワークのボトルネックからグローバルな特徴の埋め込みを抽出する知覚的注意メカニズム(PAM)を、標準の画質メトリックから導出された集約された知覚マップに組み込むことで、画質が向上することも示します。また、他の方法よりも優れたパフォーマンスを発揮します。
Generative adversarial models that capture salient low-level features which convey visual information in correlation with the human visual system (HVS) still suffer from perceptible image degradations. The inability to convey such highly informative features can be attributed to mode collapse, convergence failure and vanishing gradients. In this paper, we improve image quality adversarially by introducing a novel quality map fusion technique that harnesses image features similar to the HVS and the perceptual properties of a deep convolutional neural network (DCNN). We extend the widely adopted l2 Wasserstein distance metric to other preferable quality norms derived from Banach spaces that capture richer image properties like structure, luminance, contrast and the naturalness of images. We also show that incorporating a perceptual attention mechanism (PAM) that extracts global feature embeddings from the network bottleneck with aggregated perceptual maps derived from standard image quality metrics translate to a better image quality. We also demonstrate impressive performance over other methods.
updated: Sun Oct 24 2021 03:01:46 GMT+0000 (UTC)
published: Sun Oct 24 2021 03:01:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト