arXiv reaDer
非参照ビデオ品質評価のための一般化された時空間深部特徴表現の学習
Learning Generalized Spatial-Temporal Deep Feature Representation for No-Reference Video Quality Assessment
本研究では、クロスコンテンツ、解像度、フレームレートの品質予測において高度な一般化機能を実現することを目的とした、参照なしのビデオ品質評価方法を提案します。特に、時空間領域で効果的な特徴表現を学習することにより、ビデオの品質を評価します。空間領域では、解像度とコンテンツの変動に対処するために、品質機能にガウス分布の制約を課します。統一された配布により、異なるビデオサンプル間のドメインギャップを大幅に減らすことができ、より一般化された品質の特徴表現が得られます。視覚のメカニズムに触発された時間的次元に沿って、フレームレベルの品質を集約するために短期および長期記憶を含むことにより、ピラミッド型の時間的集約モジュールを提案します。実験は、私たちの方法がクロスデータセット設定で最先端の方法を上回り、データセット内構成で同等のパフォーマンスを達成することを示し、提案された方法の高い一般化能力を示しています。
In this work, we propose a no-reference video quality assessment method, aiming to achieve high-generalization capability in cross-content, -resolution and -frame rate quality prediction. In particular, we evaluate the quality of a video by learning effective feature representations in spatial-temporal domain. In the spatial domain, to tackle the resolution and content variations, we impose the Gaussian distribution constraints on the quality features. The unified distribution can significantly reduce the domain gap between different video samples, resulting in a more generalized quality feature representation. Along the temporal dimension, inspired by the mechanism of visual perception, we propose a pyramid temporal aggregation module by involving the short-term and long-term memory to aggregate the frame-level quality. Experiments show that our method outperforms the state-of-the-art methods on cross-dataset settings, and achieves comparable performance on intra-dataset configurations, demonstrating the high-generalization capability of the proposed method.
updated: Sun Dec 27 2020 13:11:53 GMT+0000 (UTC)
published: Sun Dec 27 2020 13:11:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト