arXiv reaDer
制御可能なキーポーズ制約を備えた音楽主導のダンス再生
Music-driven Dance Regeneration with Controllable Key Pose Constraints
この論文では、制御可能なキーポーズ制約を備えた音楽駆動型ダンスモーション合成のための新しいフレームワークを提案します。他の制御可能な条件なしで音楽のみに基づいてダンスモーションシーケンスを生成する方法とは対照的に、この作業は、音楽によって駆動される高品質のダンスモーションと、ユーザーが実行するカスタマイズされたポーズの合成を対象としています。私たちのモデルには、音楽とモーションの表現用の2つのシングルモーダルトランスフォーマーエンコーダーと、ダンスモーション生成用のクロスモーダルトランスフォーマーデコーダーが含まれています。クロスモーダルトランスデコーダーは、ローカルネイバー位置の埋め込みを導入することにより、対応する位置での主要なポーズとの一貫性を維持する、スムーズなダンスモーションシーケンスを合成する機能を実現します。このようなメカニズムにより、デコーダーはキーポーズと対応する位置に対してより敏感になります。私たちのダンス合成モデルは、広範な実験により、定量的評価と定性的評価の両方で満足のいくパフォーマンスを達成し、提案された方法の有効性を示しています。
In this paper, we propose a novel framework for music-driven dance motion synthesis with controllable key pose constraint. In contrast to methods that generate dance motion sequences only based on music without any other controllable conditions, this work targets on synthesizing high-quality dance motion driven by music as well as customized poses performed by users. Our model involves two single-modal transformer encoders for music and motion representations and a cross-modal transformer decoder for dance motions generation. The cross-modal transformer decoder achieves the capability of synthesizing smooth dance motion sequences, which keeps a consistency with key poses at corresponding positions, by introducing the local neighbor position embedding. Such mechanism makes the decoder more sensitive to key poses and the corresponding positions. Our dance synthesis model achieves satisfactory performance both on quantitative and qualitative evaluations with extensive experiments, which demonstrates the effectiveness of our proposed method.
updated: Fri Jul 08 2022 04:26:45 GMT+0000 (UTC)
published: Fri Jul 08 2022 04:26:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト