Is That a Chair? Imagining Affordances Using Simulations of an Articulated Human Body
 ロボットが現実の世界で高度な知能を発揮するには、事前に知識のないオブジェクトを評価できる必要があります。したがって、ロボットがオブジェクトとの物理的な相互作用について推論することにより、オブジェクトのアフォーダンスを認識することが重要です。この論文では、物理シミュレーションを使用してロボットにオブジェクトのアフォーダンスを想像する能力を提供する新しい方法を提案します。椅子のクラスは、より一般的なパラダイムを示すために、オブジェクトの最初のカテゴリとしてここで選択されています。私たちの方法では、ロボットは、関節式の人体とオブジェクトの間の物理的な座りの相互作用をシミュレートすることにより、任意の方向に向いたオブジェクトのアフォーダンスを椅子として「想像」します。このオブジェクトアフォーダンス推論は、オブジェクト分類(椅子と非椅子)のキューとして使用されます。さらに、オブジェクトが椅子として分類されている場合、アフォーダンス推論は、オブジェクトの直立姿勢を予測することもでき、これにより、座っているときの相互作用が可能になります。このタイプのポーズを機能ポーズと呼びます。合成3D CADモデルでの椅子の分類での方法を示します。私たちの方法はトレーニングに30モデルのみを使用しますが、直立方向がアプリオリに知られていると想定されていない場合、大量のトレーニングデータを必要とする外観ベースのディープラーニングメソッドよりも優れています。さらに、私たちの方法の機能的なポーズ予測は、合成モデルと深度カメラでスキャンされた実際のオブジェクトの両方の人間の判断とうまく一致することを示しています。
For robots to exhibit a high level of intelligence in the real world, they must be able to assess objects for which they have no prior knowledge. Therefore, it is crucial for robots to perceive object affordances by reasoning about physical interactions with the object. In this paper, we propose a novel method to provide robots with an ability to imagine object affordances using physical simulations. The class of chair is chosen here as an initial category of objects to illustrate a more general paradigm. In our method, the robot "imagines" the affordance of an arbitrarily oriented object as a chair by simulating a physical sitting interaction between an articulated human body and the object. This object affordance reasoning is used as a cue for object classification (chair vs non-chair). Moreover, if an object is classified as a chair, the affordance reasoning can also predict the upright pose of the object which allows the sitting interaction to take place. We call this type of poses the functional pose. We demonstrate our method in chair classification on synthetic 3D CAD models. Although our method uses only 30 models for training, it outperforms appearance-based deep learning methods, which require a large amount of training data, when the upright orientation is not assumed to be known a priori. In addition, we showcase that the functional pose predictions of our method align well with human judgments on both synthetic models and real objects scanned by a depth camera.
updated: Tue Apr 07 2020 21:25:42 GMT+0000 (UTC)
published: Tue Sep 17 2019 03:36:32 GMT+0000 (UTC)
