本稿では、シーンのnチャネル画像から未知のオブジェクトの対anti的ロボットグリップを生成および実行する問題に取り組むモジュール式ロボットシステムを紹介します。リアルタイム速度(〜20ms)でnチャネル入力からロバストな対pod的把握を生成できる、新規の生成的残差畳み込みニューラルネットワーク(GR-ConvNet)モデルを提案します。標準データセットと多様な世帯オブジェクトのモデルアーキテクチャを評価します。コーネルとジャカードの把握データセットで、それぞれ97.7%と94.6%の最先端の精度を達成しました。また、7 DoFロボットアームを使用して、家庭用オブジェクトと敵対オブジェクトでそれぞれ95.4%と93%の把握成功率を示しています。
In this paper, we present a modular robotic system to tackle the problem of generating and performing antipodal robotic grasps for unknown objects from n-channel image of the scene. We propose a novel Generative Residual Convolutional Neural Network (GR-ConvNet) model that can generate robust antipodal grasps from n-channel input at real-time speeds (~20ms). We evaluate the proposed model architecture on standard datasets and a diverse set of household objects. We achieved state-of-the-art accuracy of 97.7% and 94.6% on Cornell and Jacquard grasping datasets respectively. We also demonstrate a grasp success rate of 95.4% and 93% on household and adversarial objects respectively using a 7 DoF robotic arm.