arXiv reaDer
野生の単眼ビデオからのヒューマンパフォーマンスキャプチャ
Human Performance Capture from Monocular Video in the Wild
服を着た人間の動的に変形する3D形状をキャプチャすることは、VR / AR、自動運転、人間とコンピューターの相互作用など、多くのアプリケーションにとって不可欠です。既存の方法は、高価なマルチビューイメージングシステムなどの高度に特殊化されたキャプチャ設定を必要とするか、挑戦的な体のポーズに対する堅牢性に欠けています。この作品では、追加の入力なしで、挑戦的な体のポーズを特徴とする単眼ビデオからダイナミックな3D人間の形をキャプチャできる方法を提案します。まず、学習した回帰モデルに基づいて、被験者の3Dテンプレート人間モデルを構築します。次に、2D画像の観察に基づいて、困難な身体の関節の下でこのテンプレートモデルの変形を追跡します。私たちの方法は、野生の人間のビデオデータセット3DPWの最先端の方法よりも優れています。さらに、iPERデータセットからのビデオの堅牢性と一般化可能性におけるその有効性を示します。
Capturing the dynamically deforming 3D shape of clothed human is essential for numerous applications, including VR/AR, autonomous driving, and human-computer interaction. Existing methods either require a highly specialized capturing setup, such as expensive multi-view imaging systems, or they lack robustness to challenging body poses. In this work, we propose a method capable of capturing the dynamic 3D human shape from a monocular video featuring challenging body poses, without any additional input. We first build a 3D template human model of the subject based on a learned regression model. We then track this template model's deformation under challenging body articulations based on 2D image observations. Our method outperforms state-of-the-art methods on an in-the-wild human video dataset 3DPW. Moreover, we demonstrate its efficacy in robustness and generalizability on videos from iPER datasets.
updated: Mon Nov 29 2021 16:32:41 GMT+0000 (UTC)
published: Mon Nov 29 2021 16:32:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト