arXiv reaDer
VLMbench:視覚と言語の操作のための構成ベンチマーク
VLMbench: A Compositional Benchmark for Vision-and-Language Manipulation
言語の柔軟性と構成性の恩恵を受けて、人間は当然、ナビゲーションやオブジェクト操作などの複雑なタスクのために具体化されたエージェントに命令するために言語を使用することを意図しています。この作業では、具体化されたエージェントのラストマイルの空白を埋めることを目指しています。たとえば、「ボックスの横にある赤いマグカップを直立させたまま移動する」など、人間のガイダンスに従ってオブジェクトを操作します。この目的のために、自動操作ソルバー(AMSolver)シミュレーターを導入し、それに基づいて、分類されたロボット操作タスクに関するさまざまな言語命令を含む視覚および言語操作ベンチマーク(VLMbench)を構築します。具体的には、モジュール式のルールベースのタスクテンプレートが作成され、さまざまなオブジェクトの形状と外観、アクションタイプ、およびモーション制約で構成される言語命令を使用してロボットのデモンストレーションが自動的に生成されます。また、キーポイントベースのモデル6D-CLIPortを開発して、マルチビュー観測と言語入力を処理し、一連の6自由度(DoF)アクションを出力します。新しいシミュレーターとベンチマークが、言語に基づくロボット操作に関する将来の研究を促進することを願っています。
Benefiting from language flexibility and compositionality, humans naturally intend to use language to command an embodied agent for complex tasks such as navigation and object manipulation. In this work, we aim to fill the blank of the last mile of embodied agents -- object manipulation by following human guidance, e.g., "move the red mug next to the box while keeping it upright." To this end, we introduce an Automatic Manipulation Solver (AMSolver) simulator and build a Vision-and-Language Manipulation benchmark (VLMbench) based on it, containing various language instructions on categorized robotic manipulation tasks. Specifically, modular rule-based task templates are created to automatically generate robot demonstrations with language instructions, consisting of diverse object shapes and appearances, action types, and motion constraints. We also develop a keypoint-based model 6D-CLIPort to deal with multi-view observations and language input and output a sequence of 6 degrees of freedom (DoF) actions. We hope the new simulator and benchmark will facilitate future research on language-guided robotic manipulation.
updated: Fri Jun 17 2022 03:07:18 GMT+0000 (UTC)
published: Fri Jun 17 2022 03:07:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト