arXiv reaDer
Simultaneous Semantic and Collision Learning for 6-DoF Grasp Pose Estimation
シーンとオブジェクトの情報を十分に理解する能力が必要なため、雑然としたシーンを把握することは、ロボットにとって常に大きな課題でした。以前の作品は通常、オブジェクトのジオメトリ情報が利用可能であることを前提としているか、実行可能な6-DoF把握ポーズを予測するために段階的な多段階戦略を利用しています。この作業では、同時マルチタスク学習問題として6-DoF把握ポーズ推定を形式化することを提案します。統一されたフレームワークでは、実行可能な6-DoF把握ポーズ、インスタンスのセマンティックセグメンテーション、および衝突情報を共同で予測します。フレームワーク全体が共同で最適化され、エンドツーエンドで差別化できます。私たちのモデルは、実際のロボットシステムだけでなく、大規模なベンチマークでも評価されています。公開データセットでは、私たちの方法は、以前の最先端の方法を大幅に上回っています(+ 4.08AP)。また、実際のロボットプラットフォームでのモデルの実装を示し、ロボットが雑然としたシナリオでターゲットオブジェクトを高い成功率で正確に把握できることを示します。プロジェクトリンク:
Grasping in cluttered scenes has always been a great challenge for robots, due to the requirement of the ability to well understand the scene and object information. Previous works usually assume that the geometry information of the objects is available, or utilize a step-wise, multi-stage strategy to predict the feasible 6-DoF grasp poses. In this work, we propose to formalize the 6-DoF grasp pose estimation as a simultaneous multi-task learning problem. In a unified framework, we jointly predict the feasible 6-DoF grasp poses, instance semantic segmentation, and collision information. The whole framework is jointly optimized and end-to-end differentiable. Our model is evaluated on large-scale benchmarks as well as the real robot system. On the public dataset, our method outperforms prior state-of-the-art methods by a large margin (+4.08 AP). We also demonstrate the implementation of our model on a real robotic platform and show that the robot can accurately grasp target objects in cluttered scenarios with a high success rate. Project link:
updated: Thu Aug 05 2021 07:46:48 GMT+0000 (UTC)
published: Thu Aug 05 2021 07:46:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト