arXiv reaDer
キーポイントマスクを使用した画像アニメーション
Image Animation with Keypoint Mask
モーション転送は、特定のドライビングビデオからのモーションに従って、単一のソース画像の将来のビデオフレームを合成するタスクです。それを解決するために、私たちはモーション表現の困難な複雑さと、ドライビングビデオとソース画像の間の未知の関係に直面しています。その難しさにもかかわらず、この問題は、徐々に改善されて、近年の研究から大きな関心を集めました。目標は、モーションと外観の分離と見なされることがよくあります。これは、キーポイントの動きからモーションを抽出することで解決できます。入力の構造にドメイン固有のモデルを使用せずに、任意のオブジェクトにアニメーションを適用する必要がある、一般的な教師なし設定に取り組むことを選択しました。この作業では、明示的なモーション表現を使用せずに、キーポイントヒートマップから構造を抽出します。次に、画像とビデオから構造が抽出され、ディープジェネレータによってビデオに従って画像がワープされます。キーポイントモジュールの異なるステップからの構造の2つのバリエーションを提案し、優れた定性的ポーズと定量的スコアを示します。
Motion transfer is the task of synthesizing future video frames of a single source image according to the motion from a given driving video. In order to solve it, we face the challenging complexity of motion representation and the unknown relations between the driving video and the source image. Despite its difficulty, this problem attracted great interests from researches at the recent years, with gradual improvements. The goal is often thought as the decoupling of motion and appearance, which is may be solved by extracting the motion from keypoint movement. We chose to tackle the generic, unsupervised setting, where we need to apply animation to any arbitrary object, without any domain specific model for the structure of the input. In this work, we extract the structure from a keypoint heatmap, without an explicit motion representation. Then, the structures from the image and the video are extracted to warp the image according to the video, by a deep generator. We suggest two variants of the structure from different steps in the keypoint module, and show superior qualitative pose and quantitative scores.
updated: Tue Dec 21 2021 22:15:23 GMT+0000 (UTC)
published: Mon Dec 20 2021 11:35:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト