arXiv reaDer
3D人間の姿勢推定のためのクロスビューフュージョン
Cross View Fusion for 3D Human Pose Estimation
  モデルにマルチビュー幾何事前分布を組み込むことにより、マルチビュー画像から絶対3D人間ポーズを復元するアプローチを提示します。これは、2つの個別のステップで構成されます。(1)マルチビュー画像の2Dポーズを推定し、(2)マルチビュー2Dポーズから3Dポーズを回復します。まず、CNNにクロスビューフュージョンスキームを導入して、複数のビューの2Dポーズを共同で推定します。その結果、各ビューの2D姿勢推定は、すでに他のビューの恩恵を受けています。第二に、マルチビュー2Dポーズから3Dポーズを復元するための再帰的画像構造モデルを提示します。手頃な計算コストで3Dポーズの精度が徐々に向上します。 2つのパブリックデータセットH36MおよびTotal Captureでメソッドをテストします。 2つのデータセットの平均関節位置誤差は26mmと29mmであり、最新技術を著しく上回っています(26mm対52mm、29mm対35mm)。コードは\ url {https://github.com/microsoft/multiview-human-pose-estimation-pytorchで公開されています。
We present an approach to recover absolute 3D human poses from multi-view images by incorporating multi-view geometric priors in our model. It consists of two separate steps: (1) estimating the 2D poses in multi-view images and (2) recovering the 3D poses from the multi-view 2D poses. First, we introduce a cross-view fusion scheme into CNN to jointly estimate 2D poses for multiple views. Consequently, the 2D pose estimation for each view already benefits from other views. Second, we present a recursive Pictorial Structure Model to recover the 3D pose from the multi-view 2D poses. It gradually improves the accuracy of 3D pose with affordable computational cost. We test our method on two public datasets H36M and Total Capture. The Mean Per Joint Position Errors on the two datasets are 26mm and 29mm, which outperforms the state-of-the-arts remarkably (26mm vs 52mm, 29mm vs 35mm). Our code is released at \url{https://github.com/microsoft/multiview-human-pose-estimation-pytorch.
updated: Tue Sep 03 2019 14:15:30 GMT+0000 (UTC)
published: Tue Sep 03 2019 14:15:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト