近年、深層学習手法は、圧縮ビデオの品質向上タスクにおいて大きな優位性を示してきました。既存の方法は一般に生のビデオをグラウンド トゥルースとして使用し、さまざまなアーティファクトを含む連続したフレームから実用的な情報を抽出します。ただし、圧縮されたビデオの品質向上を導くために、圧縮されたビデオと未加工のビデオの有効な情報を十分に活用していません。この論文では、圧縮ビデオと生のビデオの両方から有効な情報をマイニングすることにより、圧縮ビデオの品質を向上させる独自の有効情報ガイダンス方式 (VIG) を提案します。具体的には、効率的なフレームワークである Compressed Redundancy Filtering (CRF) ネットワークを提案して、速度と強化のバランスを取ります。情報をフィルタリングして冗長性を取り除いた後、CRF は圧縮されたビデオの有効な情報を使用してテクスチャを再構築できます。さらに、追加の教師モデルと蒸留損失関数を設計する必要のない、漸進的な真実ガイダンス蒸留 (TGD) 戦略を提案します。グラウンド トゥルースのみを入力として使用して、生のフレーム全体で正しい時空間対応を集約するようにモデルを導くことで、TGD は追加のトレーニング コストを増やすことなく、拡張効果を大幅に向上させることができます。広範な実験により、当社の方法が精度と効率の点で圧縮ビデオの品質向上の最先端のパフォーマンスを達成することが示されています。
In recent years deep learning methods have shown great superiority in compressed video quality enhancement tasks. Existing methods generally take the raw video as the ground truth and extract practical information from consecutive frames containing various artifacts. However, they do not fully exploit the valid information of compressed and raw videos to guide the quality enhancement for compressed videos. In this paper, we propose a unique Valid Information Guidance scheme (VIG) to enhance the quality of compressed videos by mining valid information from both compressed videos and raw videos. Specifically, we propose an efficient framework, Compressed Redundancy Filtering (CRF) network, to balance speed and enhancement. After removing the redundancy by filtering the information, CRF can use the valid information of the compressed video to reconstruct the texture. Furthermore, we propose a progressive Truth Guidance Distillation (TGD) strategy, which does not need to design additional teacher models and distillation loss functions. By only using the ground truth as input to guide the model to aggregate the correct spatio-temporal correspondence across the raw frames, TGD can significantly improve the enhancement effect without increasing the extra training cost. Extensive experiments show that our method achieves the state-of-the-art performance of compressed video quality enhancement in terms of accuracy and efficiency.