arXiv reaDer
学習したブロックベースのハイブリッド画像圧縮
Learned Block-based Hybrid Image Compression
ニューラルネットワークに基づく学習済み画像圧縮は、非線形変換によるより良い表現の学習における優位性のおかげで大きな進歩を遂げました。一般にブロックベースである従来のハイブリッドコーディングフレームワークとは異なり、既存の学習済み画像コーデックは通常、画像をフル解像度で処理するため、並列処理や明示的な予測による高速化をサポートしていません。学習した画像コーデックと比較すると、従来のハイブリッドコーディングフレームワークは一般に手作りであり、異種のメトリックに従って最適化される適応性に欠けています。したがって、それらの優れた品質を収集し、それらの弱点を相殺するために、コーディングのパフォーマンスと効率の双方にメリットをもたらす、学習したブロックベースのハイブリッド画像圧縮(LBHIC)フレームワークを検討します。具体的には、ブロックパーティションと明示的な学習済み予測コーディングを学習済み画像圧縮フレームワークに導入します。従来のコーデックの隣接ピクセルの線形重み付けによる予測と比較して、コンテキスト予測モジュール(CPM)は、ストリッププーリングを利用して隣接する潜在空間で最も関連性の高い情報を抽出することにより、長距離相関をより適切にキャプチャするように設計されています。さらに、ブロッキングアーチファクトを軽減するために、エッジの重要性を考慮した境界認識後処理モジュール(BPM)をさらに提案します。広範な実験により、提案されたLBHICコーデックは、PSNRとMS-SSIMの両方のメトリックの点で最先端の画像圧縮方法よりも優れており、明らかな時間の節約が約束されていることが示されています。
Learned image compression based on neural networks have made huge progress thanks to its superiority in learning better representation through non-linear transformation. Different from traditional hybrid coding frameworks, that are commonly block-based, existing learned image codecs usually process the images in a full-resolution manner thus not supporting acceleration via parallelism and explicit prediction. Compared to learned image codecs, traditional hybrid coding frameworks are in general hand-crafted and lack the adaptability of being optimized according to heterogeneous metrics. Therefore, in order to collect their good qualities and offset their weakness, we explore a learned block-based hybrid image compression (LBHIC) framework, which achieves a win-win between coding performance and efficiency. Specifically, we introduce block partition and explicit learned predictive coding into learned image compression framework. Compared to prediction through linear weighting of neighbor pixels in traditional codecs, our contextual prediction module (CPM) is designed to better capture long-range correlations by utilizing the strip pooling to extract the most relevant information in neighboring latent space. Moreover, to alleviate blocking artifacts, we further propose a boundary-aware post-processing module (BPM) with the importance of edge taken into account. Extensive experiments demonstrate that the proposed LBHIC codec outperforms state-of-the-art image compression methods in terms of both PSNR and MS-SSIM metrics and promises obvious time-saving.
updated: Thu Jan 14 2021 14:24:06 GMT+0000 (UTC)
published: Thu Dec 17 2020 12:47:39 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト