現在のエンドツーエンドの把握計画方法は、さまざまなオブジェクトのセットで高い把握成功率を達成する秒単位の把握を提案しますが、多くの場合、ワークスペースを上位把握に制約します。この作業では、入力として単一のRGB-Dビューを使用して、完全な6自由度の把握を生成するためのエンドツーエンドのトップグラスプランニング方法を可能にする方法を提示します。これは、把持する物体の完全な形状を推定し、物体のさまざまな視点をシミュレートし、シミュレートされた視点をエンドツーエンドの把持生成方法に渡し、最終的に全体的な最良の把持を実行することによって実現されます。この方法は、シミュレーションカメラ画像と実際のカメラ画像の両方で、最先端のFully Convolutional Grasp Quality CNNによって生成された429グリップを比較することにより、Franka Emika Pandaで実験的に検証されました。結果は、特に実際のカメラの視点が傾斜している場合に、実際のカメラ画像よりもシミュレートされた画像を使用する場合、把握成功率に関して統計的に有意な改善を示しています。コードとビデオはhttps://irobotics.aalto.fi/beyond-top-grasps-through-scene-completion/で入手できます。
Current end-to-end grasp planning methods propose grasps in the order of seconds that attain high grasp success rates on a diverse set of objects, but often by constraining the workspace to top-grasps. In this work, we present a method that allows end-to-end top-grasp planning methods to generate full six-degree-of-freedom grasps using a single RGB-D view as input. This is achieved by estimating the complete shape of the object to be grasped, then simulating different viewpoints of the object, passing the simulated viewpoints to an end-to-end grasp generation method, and finally executing the overall best grasp. The method was experimentally validated on a Franka Emika Panda by comparing 429 grasps generated by the state-of-the-art Fully Convolutional Grasp Quality CNN, both on simulated and real camera images. The results show statistically significant improvements in terms of grasp success rate when using simulated images over real camera images, especially when the real camera viewpoint is angled. Code and video are available at https://irobotics.aalto.fi/beyond-top-grasps-through-scene-completion/.