操作計画は、物理的に実現可能性を満たしながら、オブジェクトのセットをターゲット構成に移動するロボット軌道を計算するタスクです。既知のオブジェクトテンプレートを前提とする既存の作品とは対照的に、潜在的に未知のインスタンスと大きなカテゴリ内形状バリエーションを持つオブジェクトのカテゴリの操作計画に興味があります。それを実現するためには、操作プランナーが物理的な実現可能性と望ましいオブジェクト構成の両方について推論できる一方で、新規インスタンスに一般化できるオブジェクト表現が必要です。固定テンプレートからパラメータ化された変換でオブジェクトを表現することは、カテゴリ内の大きな形状の変化をキャプチャできないため、広く使用されているポーズ表現は適していません。したがって、セマンティックキーポイントと密集したジオメトリ(点群またはメッシュ)で構成される新しいハイブリッドオブジェクト表現を、知覚モジュールとモーションプランナー間のインターフェイスとして提案します。学習ベースのキーポイント検出と形状補完の進歩を活用して、密なジオメトリとキーポイントの両方を生のセンサー入力から認識することができます。提案されたハイブリッドオブジェクト表現を使用して、オブジェクトのターゲット構成とオブジェクトのカテゴリの物理的実現可能性の両方をエンコードするモーションプランニング問題として操作タスクを定式化します。このようにして、多くの既存の操作プランナーをオブジェクトのカテゴリに一般化でき、結果として生じる知覚からアクションへの操作パイプラインは、カテゴリ内の大きな形状変化に対して堅牢です。広範なハードウェア実験により、当社のパイプラインが、これまでにないオブジェクトでタスクを達成するロボット軌道を生成できることが実証されています。
Manipulation planning is the task of computing robot trajectories that move a set of objects to their target configuration while satisfying physically feasibility. In contrast to existing works that assume known object templates, we are interested in manipulation planning for a category of objects with potentially unknown instances and large intra-category shape variation. To achieve it, we need an object representation with which the manipulation planner can reason about both the physical feasibility and desired object configuration, while being generalizable to novel instances. The widely-used pose representation is not suitable, as representing an object with a parameterized transformation from a fixed template cannot capture large intra-category shape variation. Hence, we propose a new hybrid object representation consisting of semantic keypoint and dense geometry (a point cloud or mesh) as the interface between the perception module and motion planner. Leveraging advances in learning-based keypoint detection and shape completion, both dense geometry and keypoints can be perceived from raw sensor input. Using the proposed hybrid object representation, we formulate the manipulation task as a motion planning problem which encodes both the object target configuration and physical feasibility for a category of objects. In this way, many existing manipulation planners can be generalized to categories of objects, and the resulting perception-to-action manipulation pipeline is robust to large intra-category shape variation. Extensive hardware experiments demonstrate our pipeline can produce robot trajectories that accomplish tasks with never-before-seen objects.