最初の実用的な学習されたロスレス画像圧縮システムであるL3Cを提案し、一般的な工学コーデックであるPNG、WebP、JPEG 2000よりも優れていることを示します。この方法の中核は、最適化された適応エントロピーコーディングのための完全に並列化可能な階層的確率モデルです圧縮タスクのエンドツーエンド。 PixelCNNなどの最近の自己回帰離散確率モデルとは対照的に、私たちの方法は、i)RGB空間での画像分布のみをモデル化するのではなく、学習した補助表現と共同で画像分布をモデル化し、ii)すべてのピクセル確率を予測するために3つの前方パスのみを必要としますピクセルごとに1つではなく。その結果、L3Cは、最速のPixelCNNバリアント(Multiscale-PixelCNN)と比較して、サンプリング時に2桁以上の高速化を実現します。さらに、補助表現を学習することが重要であり、RGBピラミッドなどの事前定義された補助表現を大幅に上回ることがわかります。
We propose the first practical learned lossless image compression system, L3C, and show that it outperforms the popular engineered codecs, PNG, WebP and JPEG 2000. At the core of our method is a fully parallelizable hierarchical probabilistic model for adaptive entropy coding which is optimized end-to-end for the compression task. In contrast to recent autoregressive discrete probabilistic models such as PixelCNN, our method i) models the image distribution jointly with learned auxiliary representations instead of exclusively modeling the image distribution in RGB space, and ii) only requires three forward-passes to predict all pixel probabilities instead of one for each pixel. As a result, L3C obtains over two orders of magnitude speedups when sampling compared to the fastest PixelCNN variant (Multiscale-PixelCNN). Furthermore, we find that learning the auxiliary representation is crucial and outperforms predefined auxiliary representations such as an RGB pyramid significantly.