時間的モデリングは、ビデオの超解像にとって非常に重要です。ほとんどのビデオ超解像度法は、明示的な動き補償のためにオプティカルフローまたは変形可能な畳み込みを採用しています。ただし、このような時間モデリング手法はモデルの複雑さを増し、オクルージョンや複雑なモーションの場合に失敗し、深刻な歪みやアーティファクトが発生する可能性があります。この論文では、LR空間とHR空間の両方における明示的な時間差モデリングの役割を調査することを提案します。連続するフレームをVSRモデルに直接フィードする代わりに、フレーム間の時間差を計算し、差のレベルに応じてそれらのピクセルを2つのサブセットに分割することを提案します。それらは、補完的な情報をよりよく抽出するために、異なる受容野の2つのブランチで別々に処理されます。超解像結果をさらに向上させるために、空間残差特徴が抽出されるだけでなく、高周波領域の連続するフレーム間の差も計算されます。これにより、モデルは将来と過去の両方の中間SR結果を活用して、現在のSR出力を改善できます。異なる時間ステップでの差をキャッシュして、時間のさらなる距離からの情報を現在のフレームに伝播して改良することができます。いくつかのビデオ超解像ベンチマークデータセットでの実験は、提案された方法の有効性と最先端の方法に対するその好ましい性能を示しています。
Temporal modeling is crucial for video super-resolution. Most of the video super-resolution methods adopt the optical flow or deformable convolution for explicitly motion compensation. However, such temporal modeling techniques increase the model complexity and might fail in case of occlusion or complex motion, resulting in serious distortion and artifacts. In this paper, we propose to explore the role of explicit temporal difference modeling in both LR and HR space. Instead of directly feeding consecutive frames into a VSR model, we propose to compute the temporal difference between frames and divide those pixels into two subsets according to the level of difference. They are separately processed with two branches of different receptive fields in order to better extract complementary information. To further enhance the super-resolution result, not only spatial residual features are extracted, but the difference between consecutive frames in high-frequency domain is also computed. It allows the model to exploit intermediate SR results in both future and past to refine the current SR output. The difference at different time steps could be cached such that information from further distance in time could be propagated to the current frame for refinement. Experiments on several video super-resolution benchmark datasets demonstrate the effectiveness of the proposed method and its favorable performance against state-of-the-art methods.