最近、推論によるロボット把持検出(GD)およびオブジェクト検出(OD)が、ディープニューラルネットワーク(DNN)を使用して調査されました。ロボットが単一のRGB-Dカメラから散らばった、積み重ねられた、複雑な新しいオブジェクトの山の中の特定のターゲットオブジェクトを把握する状況に対処できるように、個別のネットワークを使用してこれらのマルチタスクを組み合わせる作業がありました。単純な後処理でオブジェクト間のGD、OD、および関係推論に関する情報を生成する単一のマルチタスクDNNを提案します。提案された方法では、VMRDデータセットとCornellデータセットで、それぞれ98.6%と74.2%の精度と33および62フレーム/秒の計算速度で最先端のパフォーマンスが得られました。また、4軸ロボットアームを使用した単一の新規オブジェクトの把持成功率は95.3%、バクスターロボットを使用した散在する新規オブジェクトの把持成功率は86.7%でした。
Recently, robotic grasp detection (GD) and object detection (OD) with reasoning have been investigated using deep neural networks (DNNs). There have been works to combine these multi-tasks using separate networks so that robots can deal with situations of grasping specific target objects in the cluttered, stacked, complex piles of novel objects from a single RGB-D camera. We propose a single multi-task DNN that yields the information on GD, OD and relationship reasoning among objects with a simple post-processing. Our proposed methods yielded state-of-the-art performance with the accuracy of 98.6% and 74.2% and the computation speed of 33 and 62 frame per second on VMRD and Cornell datasets, respectively. Our methods also yielded 95.3% grasp success rate for single novel object grasping with a 4-axis robot arm and 86.7% grasp success rate in cluttered novel objects with a Baxter robot.