ヒューマン モーション生成は、人間の自然なポーズ シーケンスを生成することを目的としており、現実世界のアプリケーションに計り知れない可能性を示しています。近年、モーションデータの収集技術と生成方法が大幅に進歩し、人間のモーション生成への関心が高まる基礎が築かれています。この分野の研究のほとんどは、テキスト、オーディオ、シーンのコンテキストなどの条件付き信号に基づいて人間の動作を生成することに焦点を当てています。近年大幅な進歩が見られましたが、人間の動作の複雑な性質と条件付き信号との暗黙の関係により、このタスクは依然として課題を抱えています。この調査では、人間の動作生成に関する包括的な文献レビューを紹介します。これは、私たちの知る限り、この分野では初めてのものです。まず人間の動きと生成モデルの背景を紹介し、続いてテキスト条件付き、音声条件付き、およびシーン条件付きの人間の動きの生成という 3 つの主流のサブタスクの代表的な方法を検討します。さらに、一般的なデータセットと評価指標の概要も提供します。最後に、未解決の問題について議論し、将来の研究の方向性を概説します。私たちは、この調査がコミュニティにこの急速に進化する分野の包括的な情報を提供し、未解決の課題に対処する新しいアイデアを刺激することを願っています。
Human motion generation aims to generate natural human pose sequences and shows immense potential for real-world applications. Substantial progress has been made recently in motion data collection technologies and generation methods, laying the foundation for increasing interest in human motion generation. Most research within this field focuses on generating human motions based on conditional signals, such as text, audio, and scene contexts. While significant advancements have been made in recent years, the task continues to pose challenges due to the intricate nature of human motion and its implicit relationship with conditional signals. In this survey, we present a comprehensive literature review of human motion generation, which, to the best of our knowledge, is the first of its kind in this field. We begin by introducing the background of human motion and generative models, followed by an examination of representative methods for three mainstream sub-tasks: text-conditioned, audio-conditioned, and scene-conditioned human motion generation. Additionally, we provide an overview of common datasets and evaluation metrics. Lastly, we discuss open problems and outline potential future research directions. We hope that this survey could provide the community with a comprehensive glimpse of this rapidly evolving field and inspire novel ideas that address the outstanding challenges.