arXiv reaDer
効率的な圧縮ビデオ超解像のためのコーデック情報支援フレームワーク
A Codec Information Assisted Framework for Efficient Compressed Video Super-Resolution
圧縮されたビデオをオンラインで処理して解像度を上げることは、ますます広く注目を集めています。再帰型ニューラル ネットワーク アーキテクチャを使用したビデオ超解像度 (VSR) は、長期的な時間的依存関係を効率的にモデル化できるため、有望なソリューションです。ただし、最先端の再帰型 VSR モデルでは、主にフレーム/機能の位置合わせのための複雑なモーション推定と、連続するビデオ フレームの冗長処理のために、優れたパフォーマンスを得るために依然としてかなりの計算が必要です。この論文では、圧縮ビデオの特性を考慮して、圧縮ビデオの反復 VSR モデルを強化および加速するコーデック情報支援フレームワーク (CIAF) を提案します。まず、フレームワークはモーション ベクトルのコード化されたビデオ情報を再利用して、隣接するフレーム間の時間的な関係をモデル化します。実験では、モーション ベクトル ベースのアラインメントを使用するモデルは、より複雑なオプティカル フロー ベースのアラインメントを使用するモデルと比較しても、わずかな追加計算でパフォーマンスを大幅に向上させることができることが示されています。第 2 に、Residual のコード化されたビデオ情報をさらに利用することにより、フレームワークは、冗長なピクセルの計算をスキップするように通知されます。実験では、CRF が 23 の場合、H.264 でエンコードされた REDS4 テスト ビデオで、提案されたフレームワークがパフォーマンスを低下させることなく最大 70% の計算を節約できることが実証されています。
Online processing of compressed videos to increase their resolutions attracts increasing and broad attention. Video Super-Resolution (VSR) using recurrent neural network architecture is a promising solution due to its efficient modeling of long-range temporal dependencies. However, state-of-the-art recurrent VSR models still require significant computation to obtain a good performance, mainly because of the complicated motion estimation for frame/feature alignment and the redundant processing of consecutive video frames. In this paper, considering the characteristics of compressed videos, we propose a Codec Information Assisted Framework (CIAF) to boost and accelerate recurrent VSR models for compressed videos. Firstly, the framework reuses the coded video information of Motion Vectors to model the temporal relationships between adjacent frames. Experiments demonstrate that the models with Motion Vector based alignment can significantly boost the performance with negligible additional computation, even comparable to those using more complex optical flow based alignment. Secondly, by further making use of the coded video information of Residuals, the framework can be informed to skip the computation on redundant pixels. Experiments demonstrate that the proposed framework can save up to 70% of the computation without performance drop on the REDS4 test videos encoded by H.264 when CRF is 23.
updated: Sat Oct 15 2022 08:48:29 GMT+0000 (UTC)
published: Sat Oct 15 2022 08:48:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト