この論文では、Joint-wise reProjection-based Multi-hypothesis Aggregation (JPMA) を使用した新しい拡散ベースの 3D ポーズ推定 (D3DP) 法が、確率論的な 3D 人間のポーズ推定のために提案されています。一方では、D3DP は、単一の 2D 観測に対して複数の可能な 3D 姿勢仮説を生成します。グラウンド トゥルースの 3D ポーズをランダムな分布に徐々に拡散し、2D キーポイントを条件とするノイズ除去を学習して、汚染されていない 3D ポーズを復元します。提案された D3DP は、既存の 3D 姿勢推定器と互換性があり、ユーザーが 2 つのカスタマイズ可能なパラメーターを介して推論中に効率と精度のバランスを取ることをサポートします。一方、JPMA では、D3DP で生成された複数の仮説を 1 つの 3D ポーズにまとめて実用化することを提案しています。 3D ポーズ仮説を 2D カメラ平面に再投影し、再投影エラーに基づいてジョイントごとに最適な仮説を選択し、選択したジョイントを最終的なポーズに結合します。提案された JPMA は、ジョイント レベルで集計を行い、2D 事前情報を利用します。どちらも、以前のアプローチでは見過ごされてきました。 Human3.6M および MPI-INF-3DHP データセットに関する広範な実験では、この方法が最先端の決定論的および確率論的アプローチよりもそれぞれ 1.5% および 8.9% 優れていることが示されています。コードは https://github.com/paTRICK-swk/D3DP で入手できます。
In this paper, a novel Diffusion-based 3D Pose estimation (D3DP) method with Joint-wise reProjection-based Multi-hypothesis Aggregation (JPMA) is proposed for probabilistic 3D human pose estimation. On the one hand, D3DP generates multiple possible 3D pose hypotheses for a single 2D observation. It gradually diffuses the ground truth 3D poses to a random distribution, and learns a denoiser conditioned on 2D keypoints to recover the uncontaminated 3D poses. The proposed D3DP is compatible with existing 3D pose estimators and supports users to balance efficiency and accuracy during inference through two customizable parameters. On the other hand, JPMA is proposed to assemble multiple hypotheses generated by D3DP into a single 3D pose for practical use. It reprojects 3D pose hypotheses to the 2D camera plane, selects the best hypothesis joint-by-joint based on the reprojection errors, and combines the selected joints into the final pose. The proposed JPMA conducts aggregation at the joint level and makes use of the 2D prior information, both of which have been overlooked by previous approaches. Extensive experiments on Human3.6M and MPI-INF-3DHP datasets show that our method outperforms the state-of-the-art deterministic and probabilistic approaches by 1.5% and 8.9%, respectively. Code is available at https://github.com/paTRICK-swk/D3DP.