arXiv reaDer
ビデオ補間用のクロスアテンショントランスフォーマー
Cross-Attention Transformer for Video Interpolation
ビデオ補間用の残差ニューラルネットワークであるTAIN(ビデオ補間の変換器と注意)を提案します。これは、中間フレームの周囲に2つの連続する画像フレームがある場合に中間フレームを補間することを目的としています。最初に、Cross-Similarity(CS)という名前の新しいビジュアルトランスフォーマーモジュールを提示して、予測された補間フレームと同様の外観を持つ入力画像の特徴をグローバルに集約します。次に、これらのCS機能を使用して、内挿された予測を改良します。 CS機能のオクルージョンを説明するために、ネットワークが1つのフレームから他のフレームのCS機能に焦点を合わせることができるようにImage Attention(IA)モジュールを提案します。さらに、フレーム間を移動するオクルーダーパッチを使用してトレーニングデータセットを拡張し、オクルージョンや大きな動きに対するネットワークの堅牢性を向上させます。既存の方法では、特にMBの近くでスムーズな予測が得られるため、画像勾配に基づく追加のトレーニング損失を使用して、より鮮明な予測を行います。 TAINは、フロー推定を必要としない既存のメソッドよりも優れており、Vimeo90k、UCF101、およびSNU-FILMベンチマークでの推論時間の点で計算効率が高い一方で、フローベースのメソッドと同等のパフォーマンスを発揮します。
We propose TAIN (Transformers and Attention for video INterpolation), a residual neural network for video interpolation, which aims to interpolate an intermediate frame given two consecutive image frames around it. We first present a novel visual transformer module, named Cross-Similarity (CS), to globally aggregate input image features with similar appearance as those of the predicted interpolated frame. These CS features are then used to refine the interpolated prediction. To account for occlusions in the CS features, we propose an Image Attention (IA) module to allow the network to focus on CS features from one frame over those of the other. Additionally, we augment our training dataset with an occluder patch that moves across frames to improve the network's robustness to occlusions and large motion. Because existing methods yield smooth predictions especially near MBs, we use an additional training loss based on image gradient to yield sharper predictions. TAIN outperforms existing methods that do not require flow estimation and performs comparably to flow-based methods while being computationally efficient in terms of inference time on Vimeo90k, UCF101, and SNU-FILM benchmarks.
updated: Fri Jul 08 2022 21:38:54 GMT+0000 (UTC)
published: Fri Jul 08 2022 21:38:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト