arXiv reaDer
自己接触と人間のポーズについて
On Self-Contact and Human Pose
人々は1時間に23回顔に触れ、腕や脚を交差させ、腰に手を置くなどします。人々の多くの画像には、何らかの形の自己接触が含まれていますが、現在の3D人間のポーズと形状(HPS)回帰法は通常この連絡先の見積もりに失敗しました。これに対処するために、自己接触による人間の姿勢推定を大幅に改善する新しいデータセットと方法を開発します。最初に、3Dスキャンに適合するSMPL-XボディとAMASSからのポーズを含む、3D接触ポーズ(3DCP)のデータセットを作成します。これを改良して、良好な接触を確保します。次に、これを利用して、Amazon Mechanical Turkを介して収集された画像のMimic-The-Pose(MTP)データセットを作成します。このデータセットには、自己接触で3DCPポーズを模倣する人々が含まれています。第3に、新しいHPS最適化手法であるSMPLify-XMCを開発します。これには、接触の制約が含まれ、フィッティング中に既知の3DCPボディポーズを使用して、MTP画像のほぼグラウンドトゥルースポーズを作成します。第4に、画像の多様性を高めるために、野生の画像のデータセットに離散自己接触(DSC)情報のラベルを付け、ポーズの最適化中に離散接触を活用する別の新しい最適化手法であるSMPLify-DCを使用します。最後に、SPINトレーニング中にデータセットを使用して、TUCH(人間の接触の理解に向けて)と呼ばれる新しい3D人間ポーズリグレッサを学習します。新しい自己接触トレーニングデータが、差し控えられたテストデータや3DPWなどの既存のデータセットでの3D人間の姿勢の推定を大幅に改善することを示します。私たちの方法は、自己接触ポーズの結果を改善するだけでなく、非接触ポーズの精度も改善します。コードとデータは、https://tuch.is.tue.mpg.deで調査目的で入手できます。
People touch their face 23 times an hour, they cross their arms and legs, put their hands on their hips, etc. While many images of people contain some form of self-contact, current 3D human pose and shape (HPS) regression methods typically fail to estimate this contact. To address this, we develop new datasets and methods that significantly improve human pose estimation with self-contact. First, we create a dataset of 3D Contact Poses (3DCP) containing SMPL-X bodies fit to 3D scans as well as poses from AMASS, which we refine to ensure good contact. Second, we leverage this to create the Mimic-The-Pose (MTP) dataset of images, collected via Amazon Mechanical Turk, containing people mimicking the 3DCP poses with selfcontact. Third, we develop a novel HPS optimization method, SMPLify-XMC, that includes contact constraints and uses the known 3DCP body pose during fitting to create near ground-truth poses for MTP images. Fourth, for more image variety, we label a dataset of in-the-wild images with Discrete Self-Contact (DSC) information and use another new optimization method, SMPLify-DC, that exploits discrete contacts during pose optimization. Finally, we use our datasets during SPIN training to learn a new 3D human pose regressor, called TUCH (Towards Understanding Contact in Humans). We show that the new self-contact training data significantly improves 3D human pose estimates on withheld test data and existing datasets like 3DPW. Not only does our method improve results for self-contact poses, but it also improves accuracy for non-contact poses. The code and data are available for research purposes at https://tuch.is.tue.mpg.de.
updated: Thu Apr 08 2021 07:29:50 GMT+0000 (UTC)
published: Wed Apr 07 2021 15:10:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト