arXiv reaDer
ビットストリーム メタデータを活用して、高速、正確、一般化された圧縮ビデオの品質向上を実現
Leveraging Bitstream Metadata for Fast, Accurate, Generalized Compressed Video Quality Enhancement
ビデオ圧縮は、ソーシャル メディアからビデオ会議まで、最新のインターネット技術を支える中心的な機能です。ビデオ圧縮は成熟し続けていますが、多くの圧縮設定では、品質の低下がまだ顕著です。それでも、これらの設定には、帯域幅が制限されているか、不安定な接続でビデオを効率的に送信するための重要なアプリケーションがあります。この作業では、ビデオ ビットストリームに埋め込まれた基本的な構造とモーション情報を活用して、圧縮されたビデオの詳細を復元できるディープ ラーニング アーキテクチャを開発します。これにより、以前の圧縮補正方法と比較して復元精度が向上し、より高いスループットを達成しながら、レート歪みに関する最近のディープラーニングベースのビデオ圧縮方法と比較して競争力があることを示します。さらに、ビットストリームですぐに利用できる量子化データでモデルを調整します。これにより、以前の作業ではモデルのアンサンブルを必要としたさまざまな異なる圧縮品質設定を単一のモデルで処理できます。
Video compression is a central feature of the modern internet powering technologies from social media to video conferencing. While video compression continues to mature, for many compression settings, quality loss is still noticeable. These settings nevertheless have important applications to the efficient transmission of videos over bandwidth constrained or otherwise unstable connections. In this work, we develop a deep learning architecture capable of restoring detail to compressed videos which leverages the underlying structure and motion information embedded in the video bitstream. We show that this improves restoration accuracy compared to prior compression correction methods and is competitive when compared with recent deep-learning-based video compression methods on rate-distortion while achieving higher throughput. Furthermore, we condition our model on quantization data which is readily available in the bitstream. This allows our single model to handle a variety of different compression quality settings which required an ensemble of models in prior work.
updated: Tue Apr 25 2023 18:53:04 GMT+0000 (UTC)
published: Mon Jan 31 2022 18:56:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト