arXiv reaDer
残留ポーズ:深度ベースの3D人間ポーズ推定のための分離アプローチ
Residual Pose: A Decoupled Approach for Depth-based 3D Human Pose Estimation
畳み込みニューラルネットワーク(CNN)を使用した信頼性の高い2Dポーズ推定の最近の進歩を活用して、複数人の人間とロボットの相互作用(HRI)シナリオで深度画像から人の3Dポーズを推定することを提案します。私たちの方法は、深度情報を使用して2Dボディランドマーク検出から3Dリフトポイントを取得すると、実際の3D人間のポーズの概算が得られるため、詳細な手順のみが必要であるという観察に基づいています。その行で私たちの貢献は3つあります。 (i)2Dポーズ推定と3Dポーズリファインメントを分離することにより、深度画像から3Dポーズ推定を実行することを提案します。 (ii)持ち上げられた3Dポーズと真の3Dポーズの間の残余ポーズを回帰する深層学習アプローチを提案します。 (iii)その単純さにもかかわらず、私たちのアプローチは2つの公開データセットで精度と速度の両方で非常に競争力のある結果を達成し、したがって最近の最先端の方法と比較して複数人のHRIに魅力的であることを示します。
We propose to leverage recent advances in reliable 2D pose estimation with Convolutional Neural Networks (CNN) to estimate the 3D pose of people from depth images in multi-person Human-Robot Interaction (HRI) scenarios. Our method is based on the observation that using the depth information to obtain 3D lifted points from 2D body landmark detections provides a rough estimate of the true 3D human pose, thus requiring only a refinement step. In that line our contributions are threefold. (i) we propose to perform 3D pose estimation from depth images by decoupling 2D pose estimation and 3D pose refinement; (ii) we propose a deep-learning approach that regresses the residual pose between the lifted 3D pose and the true 3D pose; (iii) we show that despite its simplicity, our approach achieves very competitive results both in accuracy and speed on two public datasets and is therefore appealing for multi-person HRI compared to recent state-of-the-art methods.
updated: Tue Nov 10 2020 10:08:13 GMT+0000 (UTC)
published: Tue Nov 10 2020 10:08:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト