自然画像の確率構造の正確な推定は、画像圧縮において重要な役割を果たします。エンドツーエンドの最適化された画像圧縮の最近の目覚しい成功にもかかわらず、潜在コードは通常、エントロピーモデリングを簡略化するために完全に統計的に因数分解されると想定されています。ただし、この仮定は一般的に成り立たず、圧縮パフォーマンスを低下させる可能性があります。ここでは、効率的かつ効果的なエントロピーモデリングのためのコンテキストベースの畳み込みネットワーク(CCN)を紹介します。特に、3Dジグザグスキャン順序と3Dコード分割技術が導入され、並列エントロピーデコードの適切なコーディングコンテキストを定義します。どちらもボイルダウンして、変換不変のバイナリマスクをCCNの畳み込みフィルターに配置します。ロスレスとロッシーの両方の画像圧縮におけるエントロピーモデリングのためのCCNの約束を示します。前者については、画像の2値化された表現にCCNを直接適用して、エントロピー推定の各コードのベルヌーイ分布を計算します。後者の場合、各コードのカテゴリカル分布は、ガウス分布の離散化された混合によって表され、そのパラメーターは3つのCCNによって推定されます。次に、CCNベースのエントロピーモデルを、レート歪みパフォーマンスの分析および合成変換とともに共同で最適化します。 KodakとTecnickのデータセットの実験は、提案されたCCNを利用した私たちの方法は、一般に、はるかに高速でありながら、最先端の技術に匹敵する圧縮パフォーマンスを達成することを示しています。
Precise estimation of the probabilistic structure of natural images plays an essential role in image compression. Despite the recent remarkable success of end-to-end optimized image compression, the latent codes are usually assumed to be fully statistically factorized in order to simplify entropy modeling. However, this assumption generally does not hold true and may hinder compression performance. Here we present context-based convolutional networks (CCNs) for efficient and effective entropy modeling. In particular, a 3D zigzag scanning order and a 3D code dividing technique are introduced to define proper coding contexts for parallel entropy decoding, both of which boil down to place translation-invariant binary masks on convolution filters of CCNs. We demonstrate the promise of CCNs for entropy modeling in both lossless and lossy image compression. For the former, we directly apply a CCN to the binarized representation of an image to compute the Bernoulli distribution of each code for entropy estimation. For the latter, the categorical distribution of each code is represented by a discretized mixture of Gaussian distributions, whose parameters are estimated by three CCNs. We then jointly optimize the CCN-based entropy model along with analysis and synthesis transforms for rate-distortion performance. Experiments on the Kodak and Tecnick datasets show that our methods powered by the proposed CCNs generally achieve comparable compression performance to the state-of-the-art while being much faster.