arXiv reaDer
CVEGAN:圧縮ビデオエンハンスメントのための知覚に触発されたGAN
CVEGAN: A Perceptually-inspired GAN for Compressed Video Enhancement
圧縮ビデオ品質向上のための新しい生成的敵対的ネットワーク(CVEGAN)を提案します。 CVEGANジェネレーターは、新しいMul2Resブロック(複数レベルの残余学習ブランチを含む)、強化された残余非ローカルブロック(ERNB)、および強化された畳み込みブロック注意モジュール(ECBAM)の使用から恩恵を受けます。 ERNBは、表現能力を向上させるためにディスクリミネーターにも採用されています。トレーニング戦略も、ビデオ圧縮アプリケーション向けに特別に再設計され、相対論的球体GAN(ReSphereGAN)トレーニング方法と新しい知覚損失関数を採用しています。提案されたネットワークは、後処理(PP)と空間解像度適応(SRA)という2つの典型的なビデオ圧縮強化ツールのコンテキストで完全に評価されています。 CVEGANはMPEGHEVCビデオコーディングテストモデル(HM16.20)に完全に統合されており、実験結果は、既存の状態に比べて大幅なコーディングの向上(PPで最大28%、SRAで最大38%)を示しています。複数のデータセットにわたる両方のコーディングツールのアートアーキテクチャ。
We propose a new Generative Adversarial Network for Compressed Video quality Enhancement (CVEGAN). The CVEGAN generator benefits from the use of a novel Mul2Res block (with multiple levels of residual learning branches), an enhanced residual non-local block (ERNB) and an enhanced convolutional block attention module (ECBAM). The ERNB has also been employed in the discriminator to improve the representational capability. The training strategy has also been re-designed specifically for video compression applications, to employ a relativistic sphere GAN (ReSphereGAN) training methodology together with new perceptual loss functions. The proposed network has been fully evaluated in the context of two typical video compression enhancement tools: post-processing (PP) and spatial resolution adaptation (SRA). CVEGAN has been fully integrated into the MPEG HEVC video coding test model (HM16.20) and experimental results demonstrate significant coding gains (up to 28% for PP and 38% for SRA compared to the anchor) over existing state-of-the-art architectures for both coding tools across multiple datasets.
updated: Wed Nov 18 2020 10:24:38 GMT+0000 (UTC)
published: Wed Nov 18 2020 10:24:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト