arXiv reaDer
フローを正規化する確率的単眼3D人間ポーズ推定
Probabilistic Monocular 3D Human Pose Estimation with Normalizing Flows
単眼画像からの3D人間の姿勢推定は、深度のあいまいさとオクルージョンのために、非常に不適切な問題です。それにもかかわらず、ほとんどの既存の作品はこれらの曖昧さを無視し、単一の解決策を推定するだけです。対照的に、実行可能な3Dポーズの完全な事後分布を表す多様な仮説のセットを生成します。この目的のために、曖昧な逆2Dから3Dの問題を解決するために、決定論的な3Dから2Dへのマッピングを活用する正規化フローベースの方法を提案します。さらに、不確実な検出とオクルージョンは、2D検出器の不確実性情報を条件として組み込むことによって効果的にモデル化されます。成功へのさらなる鍵は、事前に学習した3Dポーズと、ベストオブM損失の一般化です。 2つのベンチマークデータセットHuman3.6MとMPI-INF-3DHPでアプローチを評価し、ほとんどのメトリックで同等のすべてのメソッドを上回っています。実装はGitHubで入手できます。
3D human pose estimation from monocular images is a highly ill-posed problem due to depth ambiguities and occlusions. Nonetheless, most existing works ignore these ambiguities and only estimate a single solution. In contrast, we generate a diverse set of hypotheses that represents the full posterior distribution of feasible 3D poses. To this end, we propose a normalizing flow based method that exploits the deterministic 3D-to-2D mapping to solve the ambiguous inverse 2D-to-3D problem. Additionally, uncertain detections and occlusions are effectively modeled by incorporating uncertainty information of the 2D detector as condition. Further keys to success are a learned 3D pose prior and a generalization of the best-of-M loss. We evaluate our approach on the two benchmark datasets Human3.6M and MPI-INF-3DHP, outperforming all comparable methods in most metrics. The implementation is available on GitHub.
updated: Mon Aug 02 2021 07:19:48 GMT+0000 (UTC)
published: Thu Jul 29 2021 07:33:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト