arXiv reaDer
VAT-Mart:3D関節オブジェクトを操作するための視覚的アクション軌道提案の学習
VAT-Mart: Learning Visual Action Trajectory Proposals for Manipulating 3D ARTiculated Objects
人間の環境で3D関節オブジェクト(キャビネット、ドアなど)を認識して操作することは、将来のホームアシスタントロボットにとって重要でありながら困難な作業です。 3D関節オブジェクトの空間は、無数のセマンティックカテゴリ、多様な形状ジオメトリ、および複雑なパーツ機能が非常に豊富です。以前の作品は主に、3D関節オブジェクトを操作するための視覚的表現として、推定された関節パラメータとパーツポーズを使用して運動学的構造を抽象化します。この論文では、知覚システムが高密度の幾何学認識、相互作用認識、およびタスク認識の視覚的行動を予測することにより、運動学的構造推定よりも実用的なガイダンスを出力する新しい知覚相互作用ハンドシェイクポイントとして、オブジェクト中心の実行可能な視覚的事前分布を提案します。アフォーダンスと軌道の提案。さまざまな相互作用の軌跡を探索する好奇心主導の強化学習ポリシーと、さまざまな形状間のポイントごとの予測のために探索された知識を要約および一般化する知覚モジュールを同時にトレーニングすることにより、このような実用的な視覚表現を学習するための知覚相互作用フレームワークVAT-Martを設計します。実験は、SAPIEN環境で大規模なPartNet-Mobilityデータセットを使用して提案されたアプローチの有効性を証明し、新しいテスト形状、見えないオブジェクトカテゴリ、および実世界のデータへの有望な一般化機能を示します。プロジェクトページ:https://hyperplane-lab.github.io/vat-mart
Perceiving and manipulating 3D articulated objects (e.g., cabinets, doors) in human environments is an important yet challenging task for future home-assistant robots. The space of 3D articulated objects is exceptionally rich in their myriad semantic categories, diverse shape geometry, and complicated part functionality. Previous works mostly abstract kinematic structure with estimated joint parameters and part poses as the visual representations for manipulating 3D articulated objects. In this paper, we propose object-centric actionable visual priors as a novel perception-interaction handshaking point that the perception system outputs more actionable guidance than kinematic structure estimation, by predicting dense geometry-aware, interaction-aware, and task-aware visual action affordance and trajectory proposals. We design an interaction-for-perception framework VAT-Mart to learn such actionable visual representations by simultaneously training a curiosity-driven reinforcement learning policy exploring diverse interaction trajectories and a perception module summarizing and generalizing the explored knowledge for pointwise predictions among diverse shapes. Experiments prove the effectiveness of the proposed approach using the large-scale PartNet-Mobility dataset in SAPIEN environment and show promising generalization capabilities to novel test shapes, unseen object categories, and real-world data. Project page: https://hyperplane-lab.github.io/vat-mart
updated: Mon Jun 28 2021 07:47:31 GMT+0000 (UTC)
published: Mon Jun 28 2021 07:47:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト