arXiv reaDer
ANFIC: Image Compression Using Augmented Normalizing Flows
このホワイトペーパーでは、Augmented Normalizing Flows(ANF)に基づいた、ANFICと呼ばれるエンドツーエンドの学習済み画像圧縮システムを紹介します。 ANFは新しいタイプのフローモデルであり、モデルの表現力を高めるために複数の変分オートエンコーダー(VAE)をスタックします。 VAEベースの画像圧縮が主流になり、有望な圧縮性能を示しています。私たちの仕事は、フローベースのフレームワークでVAEベースの圧縮を活用する最初の試みを示しています。 ANFICは、複数のVAEを階層的にスタックおよび拡張することにより、圧縮効率をさらに向上させます。 ANFの可逆性とトレーニング戦略により、ANFICは、エンコードおよびデコードネットワークを変更することなく、幅広い品質レベルをサポートできます。広範な実験結果は、PSNR-RGBに関して、ANFICが最先端の学習画像圧縮と同等またはそれ以上のパフォーマンスを発揮することを示しています。さらに、低速圧縮からほぼ可逆圧縮まで、VVCイントラコーディングに近いパフォーマンスを発揮します。特に、ANFICは、単一モデルでの可変レート圧縮の条件付き畳み込みで拡張すると、最先端のパフォーマンスを実現します。
This paper introduces an end-to-end learned image compression system, termed ANFIC, based on Augmented Normalizing Flows (ANF). ANF is a new type of flow model, which stacks multiple variational autoencoders (VAE) for greater model expressiveness. The VAE-based image compression has gone mainstream, showing promising compression performance. Our work presents the first attempt to leverage VAE-based compression in a flow-based framework. ANFIC advances further compression efficiency by stacking and extending hierarchically multiple VAE's. The invertibility of ANF, together with our training strategies, enables ANFIC to support a wide range of quality levels without changing the encoding and decoding networks. Extensive experimental results show that in terms of PSNR-RGB, ANFIC performs comparably to or better than the state-of-the-art learned image compression. Moreover, it performs close to VVC intra coding, from low-rate compression up to nearly-lossless compression. In particular, ANFIC achieves the state-of-the-art performance, when extended with conditional convolution for variable rate compression with a single model.
updated: Sun Jul 18 2021 15:02:31 GMT+0000 (UTC)
published: Sun Jul 18 2021 15:02:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト