arXiv reaDer
3D 屋内シーンでの人間の多様な動きの合成
Synthesizing Diverse Human Motions in 3D Indoor Scenes
私たちは、環境内を移動し、現実的な方法でオブジェクトと対話できる仮想人間を 3D 屋内シーンに配置するための新しい方法を紹介します。既存のアプローチは、キャ​​プチャされた人間の動きと人間が対話する 3D シーンを含むトレーニング シーケンスに依存しています。ただし、このようなインタラクション データはコストが高く、取得が困難であり、複雑な環境でのもっともらしい人間とシーンのインタラクションをすべてカバーすることはほとんどできません。これらの課題に対処するために、学習したモーション制御ポリシーによって仮想人間が 3D シーン内を移動し、現実的かつ自律的にオブジェクトと対話できるようにする強化学習ベースのアプローチを提案します。モーション コントロール ポリシーは、現実的なモーション プリミティブに対応する潜在モーション アクション スペースを採用しており、強力な生成モーション モデルを使用して大規模なモーション キャプチャ データから学習されます。 3D 環境でのナビゲーションについては、衝突回避のための新しい状態と報酬の設計を備えたシーン認識ポリシーを提案します。中間ウェイポイントを生成するナビゲーション メッシュ ベースの経路探索アルゴリズムと組み合わせることで、私たちのアプローチは、3D 屋内シーンでナビゲーションし、障害物を回避するさまざまな人間の動きの合成を可能にします。きめ細かい人間とオブジェクトのインタラクションを生成するために、マーカーベースの身体表現を使用してインタラクションの目標ガイダンスを慎重に精選し、符号付き距離フィールド (SDF) に基づく機能を活用して人間とシーンの近接関係をエンコードします。私たちの方法は、オブジェクトの形状、方向、開始時の体の位置、ポーズが分布外のテストシナリオであっても、現実的で多様な人間とオブジェクトのインタラクション(椅子に座ってから立ち上がるなど)を合成できます。実験結果は、私たちのアプローチが動きの自然さと多様性の両方の点で最先端の方法よりも優れていることを示しています。コードとビデオの結果は、https://zkf1997.github.io/DIMOS で入手できます。
We present a novel method for populating 3D indoor scenes with virtual humans that can navigate in the environment and interact with objects in a realistic manner. Existing approaches rely on training sequences that contain captured human motions and the 3D scenes they interact with. However, such interaction data are costly, difficult to capture, and can hardly cover all plausible human-scene interactions in complex environments. To address these challenges, we propose a reinforcement learning-based approach that enables virtual humans to navigate in 3D scenes and interact with objects realistically and autonomously, driven by learned motion control policies. The motion control policies employ latent motion action spaces, which correspond to realistic motion primitives and are learned from large-scale motion capture data using a powerful generative motion model. For navigation in a 3D environment, we propose a scene-aware policy with novel state and reward designs for collision avoidance. Combined with navigation mesh-based path-finding algorithms to generate intermediate waypoints, our approach enables the synthesis of diverse human motions navigating in 3D indoor scenes and avoiding obstacles. To generate fine-grained human-object interactions, we carefully curate interaction goal guidance using a marker-based body representation and leverage features based on the signed distance field (SDF) to encode human-scene proximity relations. Our method can synthesize realistic and diverse human-object interactions (e.g.,~sitting on a chair and then getting up) even for out-of-distribution test scenarios with different object shapes, orientations, starting body positions, and poses. Experimental results demonstrate that our approach outperforms state-of-the-art methods in terms of both motion naturalness and diversity. Code and video results are available at: https://zkf1997.github.io/DIMOS.
updated: Mon Aug 21 2023 09:07:07 GMT+0000 (UTC)
published: Sun May 21 2023 09:22:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト