arXiv reaDer
学習画像圧縮のための多段階空間コンテキスト モデル
Multistage Spatial Context Models for Learned Image Compression
最近の最先端の Learned Image Compression メソッドは、空間コンテキスト モデルを特徴としており、ハイパープライオリティ メソッドよりも大幅なレート歪みの改善を達成しています。ただし、自己回帰コンテキスト モデルにはシリアル デコードが必要であり、実行時のパフォーマンスが制限されます。チェッカーボード コンテキスト モデルを使用すると、RD パフォーマンスが低下しますが、並列デコードが可能になります。高速デコードと優れた RD パフォーマンスの両方を可能にする一連の多段階空間コンテキスト モデルを提示します。潜在空間を正方形のパッチに分割し、各パッチ内で順次デコードし、異なるパッチを並行してデコードします。提案された方法は、Autoregressive の RD パフォーマンスに到達し、Autoregressive よりも優れている一方で、Checkerboard に匹敵するデコード速度を備えています。各パッチ内では、デコード順序を慎重に決定する必要があります。順序が悪いとパフォーマンスに悪影響を及ぼすためです。したがって、復号順序の最適化アルゴリズムも提案します。
Recent state-of-the-art Learned Image Compression methods feature spatial context models, achieving great rate-distortion improvements over hyperprior methods. However, the autoregressive context model requires serial decoding, limiting runtime performance. The Checkerboard context model allows parallel decoding at a cost of reduced RD performance. We present a series of multistage spatial context models allowing both fast decoding and better RD performance. We split the latent space into square patches and decode serially within each patch while different patches are decoded in parallel. The proposed method features a comparable decoding speed to Checkerboard while reaching the RD performance of Autoregressive and even also outperforming Autoregressive. Inside each patch, the decoding order must be carefully decided as a bad order negatively impacts performance; therefore, we also propose a decoding order optimization algorithm.
updated: Sat Feb 18 2023 08:55:54 GMT+0000 (UTC)
published: Sat Feb 18 2023 08:55:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト