arXiv reaDer
マルチビュー ジオメトリを使用した教師なし 3D キーポイント推定
Unsupervised 3D Keypoint Estimation with Multi-View Geometry
十分な注釈付きのトレーニング データがあれば、3D 人間の姿勢推定モデルは高い精度を達成できます。ただし、特に通常とは異なるアクティビティを実行しているユーザーの場合、注釈が常に利用できるとは限りません。この論文では、マルチビュージオメトリが提供する制約以外の監視なしで、マルチビューから人体の3Dキーポイントを検出することを学習するアルゴリズムを提案します。推定された 3D キーポイントが意味のあるものであることを確認するために、それらが各ビューに再投影され、モデル自体が最初に推定した人物のマスクが推定されます。私たちのアプローチは、Human3.6M および MPI-INF-3DHP ベンチマーク データセットで、他の最先端の教師なし 3D 人間姿勢推定方法よりも優れています。
Given enough annotated training data, 3D human pose estimation models can achieve high accuracy. However, annotations are not always available, especially for people performing unusual activities. In this paper, we propose an algorithm that learns to detect 3D keypoints on human bodies from multiple-views without any supervision other than the constraints multiple-view geometry provides. To ensure that the estimated 3D keypoints are meaningful, they are re-projected to each view to estimate the person's mask that the model itself has initially estimated. Our approach outperforms other state-of-the-art unsupervised 3D human pose estimation methods on the Human3.6M and MPI-INF-3DHP benchmark datasets.
updated: Wed Nov 23 2022 10:25:12 GMT+0000 (UTC)
published: Wed Nov 23 2022 10:25:12 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト