arXiv reaDer
EDGE: 音楽からの編集可能なダンス生成
EDGE: Editable Dance Generation From Music
ダンスは重要な人間の芸術形式ですが、新しいダンスを作成するのは難しく、時間がかかる場合があります。この作業では、入力音楽に忠実でありながら、現実的で物理的にもっともらしいダンスを作成できる、編集可能なダンス生成のための最先端の方法である Editable Dance GENeration (EDGE) を紹介します。 EDGE は、トランスフォーマー ベースの拡散モデルを強力な音楽特徴抽出ツールである Jukebox と組み合わせて使用し、ジョイントごとのコンディショニングやインビトウィーンなど、ダンスに適した強力な編集機能を提供します。物理的妥当性のための新しいメトリックを導入し、(1) 物理的妥当性、ビートアライメント、および多様性ベンチマークに関する複数の定量的メトリック、およびさらに重要なこととして、(2) 大規模なユーザー調査を通じて、この方法によって生成されたダンスの品質を広範囲に評価します。これまでの最先端の方法に比べて大幅な改善を示しています。私たちのモデルからの定性的なサンプルは、私たちのウェブサイトで見つけることができます.
Dance is an important human art form, but creating new dances can be difficult and time-consuming. In this work, we introduce Editable Dance GEneration (EDGE), a state-of-the-art method for editable dance generation that is capable of creating realistic, physically-plausible dances while remaining faithful to the input music. EDGE uses a transformer-based diffusion model paired with Jukebox, a strong music feature extractor, and confers powerful editing capabilities well-suited to dance, including joint-wise conditioning, and in-betweening. We introduce a new metric for physical plausibility, and evaluate dance quality generated by our method extensively through (1) multiple quantitative metrics on physical plausibility, beat alignment, and diversity benchmarks, and more importantly, (2) a large-scale user study, demonstrating a significant improvement over previous state-of-the-art methods. Qualitative samples from our model can be found at our website.
updated: Sat Nov 19 2022 10:41:38 GMT+0000 (UTC)
published: Sat Nov 19 2022 10:41:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト