arXiv reaDer
RQAT-INR: 暗黙的ニューラル画像圧縮の改善
RQAT-INR: Improved Implicit Neural Image Compression
画像およびビデオ圧縮用の深層変分オートエンコーダーは、AVC、HEVC、VVC などの数十年にわたる従来のコーデックと比較して、競争力のある、またはより優れた圧縮率を提供できる可能性があるため、近年大きな魅力を獲得しています。しかし、複雑さとエネルギー消費のために、これらのアプローチはまだ産業界での実用化には程遠いものです。最近では、暗黙的なニューラル表現 (INR) ベースのコーデックが登場し、デコード時の複雑さとエネルギー使用量が従来のアプローチよりも低くなりました。しかし、彼らのパフォーマンスは、現時点では最先端の方法と同等ではありません。この研究では、最初に INR ベースの画像コーデックが VAE ベースのアプローチよりも複雑さが低いことを示し、次に INR ベースの画像コーデックのいくつかの改善を提案し、ベースライン モデルを大幅に上回りました。
Deep variational autoencoders for image and video compression have gained significant attraction in the recent years, due to their potential to offer competitive or better compression rates compared to the decades long traditional codecs such as AVC, HEVC or VVC. However, because of complexity and energy consumption, these approaches are still far away from practical usage in industry. More recently, implicit neural representation (INR) based codecs have emerged, and have lower complexity and energy usage to classical approaches at decoding. However, their performances are not in par at the moment with state-of-the-art methods. In this research, we first show that INR based image codec has a lower complexity than VAE based approaches, then we propose several improvements for INR-based image codec and outperformed baseline model by a large margin.
updated: Mon Mar 06 2023 10:59:45 GMT+0000 (UTC)
published: Mon Mar 06 2023 10:59:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト