arXiv reaDer
制御可能な時空間ビデオ超解像のための時間変調ネットワーク
Temporal Modulation Network for Controllable Space-Time Video Super-Resolution
時空間ビデオ超解像(STVSR)は、低解像度および低フレームレートのビデオの空間的および時間的解像度を向上させることを目的としています。最近、変形可能な畳み込みベースの方法が有望なSTVSRパフォーマンスを達成しましたが、トレーニング段階で事前定義された中間フレームしか推測できませんでした。さらに、これらの方法は、隣接するフレーム間の短期的な動きの手がかりを過小評価していました。この論文では、正確な高解像度の再構成で任意の中間フレームを補間するための時間変調ネットワーク(TMNet)を提案します。具体的には、制御可能な特徴補間のために変形可能な畳み込みカーネルを変調するための時間変調ブロック(TMB)を提案します。時間情報をうまく活用するために、ビデオ内の短期および長期のモーションキューを抽出するために、双方向変形可能ConvLSTMとともにローカル時間機能比較(LFC)モジュールを提案します。 3つのベンチマークデータセットでの実験は、TMNetが以前のSTVSRメソッドよりも優れていることを示しています。コードはhttps://github.com/CS-GangXu/TMNetで入手できます。
Space-time video super-resolution (STVSR) aims to increase the spatial and temporal resolutions of low-resolution and low-frame-rate videos. Recently, deformable convolution based methods have achieved promising STVSR performance, but they could only infer the intermediate frame pre-defined in the training stage. Besides, these methods undervalued the short-term motion cues among adjacent frames. In this paper, we propose a Temporal Modulation Network (TMNet) to interpolate arbitrary intermediate frame(s) with accurate high-resolution reconstruction. Specifically, we propose a Temporal Modulation Block (TMB) to modulate deformable convolution kernels for controllable feature interpolation. To well exploit the temporal information, we propose a Locally-temporal Feature Comparison (LFC) module, along with the Bi-directional Deformable ConvLSTM, to extract short-term and long-term motion cues in videos. Experiments on three benchmark datasets demonstrate that our TMNet outperforms previous STVSR methods. The code is available at https://github.com/CS-GangXu/TMNet.
updated: Wed Apr 21 2021 17:10:53 GMT+0000 (UTC)
published: Wed Apr 21 2021 17:10:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト