ビデオ フレーム補間 (VFI) は、近年大きな進歩を遂げています。既存の VFI モデルは、精度と効率の間の適切なトレードオフを達成するのに依然として苦労していますが、高速モデルは精度が劣ることがよくあります。通常、正確なモデルはゆっくりと実行されます。ただし、小さな動きや明確なテクスチャを使用した簡単なサンプルは、単純なモデルで競争力のある結果を達成でき、重い計算を必要としません。このホワイト ペーパーでは、難易度評価とビデオ フレーム補間を組み合わせた統合パイプラインを紹介します。具体的には、まず事前評価モデルを利用して入力フレームの補間難易度を測定し、次に適切な VFI モデルを動的に選択して補間結果を生成します。さらに、大規模な VFI 難易度評価データセットが収集され、事前評価モデルをトレーニングするために注釈が付けられます。広範な実験は、簡単なサンプルが高速モデルを通過する一方で、困難なサンプルが重いモデルで推論することを示しており、提案されたパイプラインは VFI の精度と効率のトレードオフを改善できます。
Video frame interpolation(VFI) has witnessed great progress in recent years. While existing VFI models still struggle to achieve a good trade-off between accuracy and efficiency: fast models often have inferior accuracy; accurate models typically run slowly. However, easy samples with small motion or clear texture can achieve competitive results with simple models and do not require heavy computation. In this paper, we present an integrated pipeline which combines difficulty assessment with video frame interpolation. Specifically, it firstly leverages a pre-assessment model to measure the interpolation difficulty level of input frames, and then dynamically selects an appropriate VFI model to generate interpolation results. Furthermore, a large-scale VFI difficulty assessment dataset is collected and annotated to train our pre-assessment model. Extensive experiments show that easy samples pass through fast models while difficult samples inference with heavy models, and our proposed pipeline can improve the accuracy-efficiency trade-off for VFI.