arXiv reaDer
中間レンダリング:アクション補間のためのモーションガイドビデオ合成
Render In-between: Motion Guided Video Synthesis for Action Interpolation
人間の活動のビデオをアップサンプリングすることは、ゲームからエンターテインメント、スポーツ放送に至るまで、多くの潜在的なアプリケーションを伴う、興味深いが挑戦的なタスクです。この設定でビデオフレームを合成する際の主な問題は、人間の動きの非常に複雑で非線形の性質と、体の複雑な外観とテクスチャに起因します。リアルな人間の動きと外観を生成できるモーションガイドフレームアップサンプリングフレームワークでこれらの問題に対処することを提案します。新しいモーションモデルは、大規模なモーションキャプチャデータセット(AMASS)を活用して、フレーム間の非線形骨格運動を推測するようにトレーニングされています。次に、高フレームレートのポーズ予測がニューラルレンダリングパイプラインによって使用され、ポーズと背景の一貫性を考慮して、フルフレーム出力が生成されます。私たちのパイプラインは、低フレームレートのビデオと対になっていない人間の動きのデータのみを必要とし、トレーニングのために高フレームレートのビデオを必要としません。さらに、このタスクのための人間の活動の高品質で高フレームレートのビデオで構成される最初の評価データセットを提供します。最先端のビデオ補間技術と比較して、私たちの方法は、より良い品質と精度で中間フレームを生成します。これは、ピクセルレベルの分布メトリックと比較ユーザー評価に関する最先端の結果から明らかです。コードと収集されたデータセットは、https://git.io/Render-In-Betweenで入手できます。
Upsampling videos of human activity is an interesting yet challenging task with many potential applications ranging from gaming to entertainment and sports broadcasting. The main difficulty in synthesizing video frames in this setting stems from the highly complex and non-linear nature of human motion and the complex appearance and texture of the body. We propose to address these issues in a motion-guided frame-upsampling framework that is capable of producing realistic human motion and appearance. A novel motion model is trained to inference the non-linear skeletal motion between frames by leveraging a large-scale motion-capture dataset (AMASS). The high-frame-rate pose predictions are then used by a neural rendering pipeline to produce the full-frame output, taking the pose and background consistency into consideration. Our pipeline only requires low-frame-rate videos and unpaired human motion data but does not require high-frame-rate videos for training. Furthermore, we contribute the first evaluation dataset that consists of high-quality and high-frame-rate videos of human activities for this task. Compared with state-of-the-art video interpolation techniques, our method produces in-between frames with better quality and accuracy, which is evident by state-of-the-art results on pixel-level, distributional metrics and comparative user evaluations. Our code and the collected dataset are available at https://git.io/Render-In-Between.
updated: Mon Nov 01 2021 15:32:51 GMT+0000 (UTC)
published: Mon Nov 01 2021 15:32:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト