arXiv reaDer
制御可能な運動拡散モデル
Controllable Motion Diffusion Model
仮想キャラクターの現実的で制御可能なモーションを生成することは、コンピューター アニメーションにおいて困難な作業であり、その影響はゲーム、シミュレーション、仮想現実にまで及びます。最近の研究では、画像生成における拡散モデルの成功からインスピレーションを得ており、この課題に対処できる可能性が実証されています。ただし、これらの研究の大部分は、すべてのステップを同時に生成するシーケンス レベルの生成を対象とするオフライン アプリケーションに限定されています。時変制御信号に応答して拡散モデルを使用したリアルタイムのモーション合成を可能にするために、Controllable Motion Diffusion Model (COMODO) のフレームワークを提案します。私たちのフレームワークは、モーション シーケンスを段階的に生成する自己回帰モーション拡散モデル (A-MDM) から始まります。このようにして、複雑さを追加することなく標準の DDPM アルゴリズムを使用するだけで、私たちのフレームワークは、さまざまな種類の制御信号を使用して長期間にわたって高忠実度のモーション シーケンスを生成できます。次に、A-MDM モデルに基づいて強化学習ベースのコントローラーと制御戦略を提案します。これにより、フレームワークは、ターゲット到達、ジョイスティックベースの制御、目標指向制御、そして軌跡を追っていく。提案されたフレームワークは、ユーザーのコマンドにオンザフライで適応的に反応する多様なモーションのリアルタイム生成を可能にし、それによって全体的なユーザーエクスペリエンスを向上させます。さらに、インペイントベースの編集方法と互換性があり、基本的なモーション生成モデルをさらに微調整することなく、より多様なモーションを予測できます。私たちは包括的な実験を行って、さまざまなタスクを実行する際のフレームワークの有効性を評価し、そのパフォーマンスを最先端の方法と比較します。
Generating realistic and controllable motions for virtual characters is a challenging task in computer animation, and its implications extend to games, simulations, and virtual reality. Recent studies have drawn inspiration from the success of diffusion models in image generation, demonstrating the potential for addressing this task. However, the majority of these studies have been limited to offline applications that target at sequence-level generation that generates all steps simultaneously. To enable real-time motion synthesis with diffusion models in response to time-varying control signals, we propose the framework of the Controllable Motion Diffusion Model (COMODO). Our framework begins with an auto-regressive motion diffusion model (A-MDM), which generates motion sequences step by step. In this way, simply using the standard DDPM algorithm without any additional complexity, our framework is able to generate high-fidelity motion sequences over extended periods with different types of control signals. Then, we propose our reinforcement learning-based controller and controlling strategies on top of the A-MDM model, so that our framework can steer the motion synthesis process across multiple tasks, including target reaching, joystick-based control, goal-oriented control, and trajectory following. The proposed framework enables the real-time generation of diverse motions that react adaptively to user commands on-the-fly, thereby enhancing the overall user experience. Besides, it is compatible with the inpainting-based editing methods and can predict much more diverse motions without additional fine-tuning of the basic motion generation models. We conduct comprehensive experiments to evaluate the effectiveness of our framework in performing various tasks and compare its performance against state-of-the-art methods.
updated: Thu Jun 01 2023 07:48:34 GMT+0000 (UTC)
published: Thu Jun 01 2023 07:48:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト