arXiv reaDer
把握分野:人間の把握のための暗黙の表現の学習
Grasping Field: Learning Implicit Representations for Human Grasps
近年、家財道具のロボットによる把握が目覚ましい進歩を遂げています。それでも、人間の把握を現実的に合成することは依然として困難です。主な理由はいくつかあります。(1)人間の手には多くの自由度があります(ロボットマニピュレータよりも)。 (2)合成された手は、オブジェクトの表面に一致する必要があります。 (3)意味的および物理的にもっともらしい方法でオブジェクトと相互作用する必要があります。この方向に進歩を遂げるために、3Dオブジェクト再構成のための学習ベースの陰的表現に関する最近の進歩からインスピレーションを得ています。具体的には、ディープニューラルネットワークと効率的かつ簡単に統合できる人間の把握モデリングの表現表現を提案します。私たちの洞察は、3次元空間のすべての点は、それぞれ手と物体の表面までの符号付き距離によって特徴付けることができるということです。その結果、手、オブジェクト、および接触領域は、手とオブジェクトの間の近接性を明示的にモデル化できる、共通空間内の陰関数曲面によって表すことができます。この3Dから2DへのマッピングをGraspingFieldと名付け、ディープニューラルネットワークでパラメーター化し、データから学習します。提案された把持フィールドが人間の把持生成のための効果的で表現力豊かな表現であることを示します。具体的には、私たちの生成モデルは、3Dオブジェクトの点群でのみ与えられる高品質の人間の把握を合成することができます。広範な実験は、私たちの生成モデルが強力なベースラインと比べて遜色なく、自然な人間の把握のレベルに近づいていることを示しています。私たちの方法は、手と物体の接触再構成の物理的妥当性を改善し、最先端の方法と比較して3D手の再構成で同等のパフォーマンスを実現します。
Robotic grasping of house-hold objects has made remarkable progress in recent years. Yet, human grasps are still difficult to synthesize realistically. There are several key reasons: (1) the human hand has many degrees of freedom (more than robotic manipulators); (2) the synthesized hand should conform to the surface of the object; and (3) it should interact with the object in a semantically and physically plausible manner. To make progress in this direction, we draw inspiration from the recent progress on learning-based implicit representations for 3D object reconstruction. Specifically, we propose an expressive representation for human grasp modelling that is efficient and easy to integrate with deep neural networks. Our insight is that every point in a three-dimensional space can be characterized by the signed distances to the surface of the hand and the object, respectively. Consequently, the hand, the object, and the contact area can be represented by implicit surfaces in a common space, in which the proximity between the hand and the object can be modelled explicitly. We name this 3D to 2D mapping as Grasping Field, parameterize it with a deep neural network, and learn it from data. We demonstrate that the proposed grasping field is an effective and expressive representation for human grasp generation. Specifically, our generative model is able to synthesize high-quality human grasps, given only on a 3D object point cloud. The extensive experiments demonstrate that our generative model compares favorably with a strong baseline and approaches the level of natural human grasps. Our method improves the physical plausibility of the hand-object contact reconstruction and achieves comparable performance for 3D hand reconstruction compared to state-of-the-art methods.
updated: Thu Nov 26 2020 16:07:13 GMT+0000 (UTC)
published: Mon Aug 10 2020 23:08:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト