arXiv reaDer
学習したブロックベースのハイブリッド画像圧縮
Learned Block-based Hybrid Image Compression
学習した画像圧縮に関する最近の研究では、エンコードとデコードのプロセスがフル解像度で実行されるため、実際のアプリケーションに展開すると2つの問題が発生します。第一に、自己回帰エントロピーモデルの並列加速は、シリアルデコードのために達成できません。第2に、フル解像度の推論は、特に高解像度の画像の場合、限られたGPUリソースでメモリ不足(OOM)の問題を引き起こすことがよくあります。ブロックパーティションは、上記の問題を処理するための優れた設計上の選択ですが、ブロック間の冗長性を減らし、ブロックの影響を排除するという新たな課題をもたらします。上記の課題に取り組むために、このペーパーでは、学習したブロックベースのハイブリッド画像圧縮(LBHIC)フレームワークを提供します。具体的には、隣接するブロック間の関係を利用するために、学習した画像圧縮フレームワークに明示的なイントラ予測を導入します。従来のコーデックの隣接ピクセルの線形重み付けによるコンテキストモデリングよりも優れており、ストリッププーリングを利用して隣接する潜在空間で最も関連性の高い情報を抽出し、効果的な情報を実現することで、長距離相関をより適切にキャプチャするコンテキスト予測モジュール(CPM)を提案します。予測。さらに、ブロッキングアーティファクトを軽減するために、エッジの重要性を考慮した境界認識後処理モジュール(BPM)をさらに提案します。広範な実験により、提案されたLBHICコーデックはVVCを上回り、ビットレートを4.1%節約し、最先端の学習画像圧縮方法と比較してデコード時間を約86.7%短縮することが実証されています。
Recent works on learned image compression perform encoding and decoding processes in a full-resolution manner, resulting in two problems when deployed for practical applications. First, parallel acceleration of the autoregressive entropy model cannot be achieved due to serial decoding. Second, full-resolution inference often causes the out-of-memory(OOM) problem with limited GPU resources, especially for high-resolution images. Block partition is a good design choice to handle the above issues, but it brings about new challenges in reducing the redundancy between blocks and eliminating block effects. To tackle the above challenges, this paper provides a learned block-based hybrid image compression (LBHIC) framework. Specifically, we introduce explicit intra prediction into a learned image compression framework to utilize the relation among adjacent blocks. Superior to context modeling by linear weighting of neighbor pixels in traditional codecs, we propose a contextual prediction module (CPM) to better capture long-range correlations by utilizing the strip pooling to extract the most relevant information in neighboring latent space, thus achieving effective information prediction. Moreover, to alleviate blocking artifacts, we further propose a boundary-aware postprocessing module (BPM) with the edge importance taken into account. Extensive experiments demonstrate that the proposed LBHIC codec outperforms the VVC, with a bit-rate conservation of 4.1%, and reduces the decoding time by approximately 86.7% compared with that of state-of-the-art learned image compression methods.
updated: Mon Oct 11 2021 08:25:59 GMT+0000 (UTC)
published: Thu Dec 17 2020 12:47:39 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト