この論文では、GraviCap、つまり、単眼RGBビデオからのマーカーレス3D人間モーションキャプチャとオブジェクト軌道推定の新しいアプローチを提案します。自由飛行中に部分的に観測された物体のあるシーンに焦点を当てます。既存の単眼法とは対照的に、重力を制約するオブジェクトの動きを認識しているため、スケール、オブジェクトの軌道、メートル単位の人間の骨の長さ、および地面の向きを復元できます。私たちの目的関数は、オブジェクトの初速度と位置、重力方向と焦点距離によってパラメーター化され、1つまたは複数の自由飛行エピソードに対して共同で最適化されます。提案された人間と物体の相互作用の制約により、3D再構成の幾何学的な一貫性が保証され、制約のない場合と比較して人間のポーズの物理的妥当性が向上します。 GraviCapを、無料飛行中の人やさまざまなオブジェクトのグラウンドトゥルースアノテーションを使用した新しいデータセットで評価します。実験では、私たちのアプローチは、さまざまなメトリックで3D人間のモーションキャプチャの最先端の精度を達成します。補足ビデオをご覧になることをお勧めします。ソースコードとデータセットの両方がリリースされます。 http://4dqv.mpi-inf.mpg.de/GraviCap/を参照してください。
This paper proposes GraviCap, i.e., a new approach for joint markerless 3D human motion capture and object trajectory estimation from monocular RGB videos. We focus on scenes with objects partially observed during a free flight. In contrast to existing monocular methods, we can recover scale, object trajectories as well as human bone lengths in meters and the ground plane's orientation, thanks to the awareness of the gravity constraining object motions. Our objective function is parametrised by the object's initial velocity and position, gravity direction and focal length, and jointly optimised for one or several free flight episodes. The proposed human-object interaction constraints ensure geometric consistency of the 3D reconstructions and improved physical plausibility of human poses compared to the unconstrained case. We evaluate GraviCap on a new dataset with ground-truth annotations for persons and different objects undergoing free flights. In the experiments, our approach achieves state-of-the-art accuracy in 3D human motion capture on various metrics. We urge the reader to watch our supplementary video. Both the source code and the dataset are released; see http://4dqv.mpi-inf.mpg.de/GraviCap/.