arXiv reaDer
MEMC-Net: ビデオ補間およびエンハンスメントのための動き推定および動き補償駆動型ニューラルネットワーク
MEMC-Net: Motion Estimation and Motion Compensation Driven Neural Network for Video Interpolation and Enhancement
動き推定(ME)と動き補償(MC)は、過去数十年にわたって古典的なビデオフレーム補間システムに広く使用されてきた。最近では、畳み込みニューラルネットワークを用いたデータ駆動型のフレーム補間手法が数多く提案されている。しかし、既存の学習ベースの手法では、一般的にフローカーネルまたは補償カーネルのいずれかを推定するため、計算効率と補間精度の両方で性能が制限される。本研究では、動き推定と補償に駆動されたビデオフレーム補間のためのニューラルネットワークを提案する。新しい適応ワーピング層を開発し、オプティカルフローと補間の両方のカーネルを統合して、ターゲットフレームのピクセルを合成する。この層は完全に微分可能であるため、フローとカーネルの両方の推定ネットワークを共同で最適化することができる。提案モデルは、手作りの特徴量を使用せずに、動きの推定と補償の手法の利点を活用する。既存の手法と比較して、我々のアプローチは、計算効率が高く、より視覚的に魅力的な結果を生成することができる。さらに、提案するMEMC-Netは、超解像、ノイズ除去、デブロッキングなど、いくつかの動画改善タスクにシームレスに適用することができる。定量的、定性的な評価を行った結果、提案手法は、さまざまなデータセットにおいて、最先端のビデオフレーム補間および改善アルゴリズムに対して良好な性能を示すことがわかった。
Motion estimation (ME) and motion compensation (MC) have been widely used for classical video frame interpolation systems over the past decades. Recently, a number of data-driven frame interpolation methods based on convolutional neural networks have been proposed. However, existing learning based methods typically estimate either flow or compensation kernels, thereby limiting performance on both computational efficiency and interpolation accuracy. In this work, we propose a motion estimation and compensation driven neural network for video frame interpolation. A novel adaptive warping layer is developed to integrate both optical flow and interpolation kernels to synthesize target frame pixels. This layer is fully differentiable such that both the flow and kernel estimation networks can be optimized jointly. The proposed model benefits from the advantages of motion estimation and compensation methods without using hand-crafted features. Compared to existing methods, our approach is computationally efficient and able to generate more visually appealing results. Furthermore, the proposed MEMC-Net can be seamlessly adapted to several video enhancement tasks, e.g., super-resolution, denoising, and deblocking. Extensive quantitative and qualitative evaluations demonstrate that the proposed method performs favorably against the state-of-the-art video frame interpolation and enhancement algorithms on a wide range of datasets.
updated: Thu Sep 05 2019 08:35:29 GMT+0000 (UTC)
published: Sat Oct 20 2018 07:47:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト