arXiv reaDer
高レベルの自然言語命令実行のための永続的な空間意味表現
A Persistent Spatial Semantic Representation for High-level Natural Language Instruction Execution
自然言語は、ロボットエージェントの長期的なタスクを指定するためのアクセス可能で表現力豊かなインターフェイスを提供します。ただし、専門家以外の人は、抽象化のいくつかのレイヤーを通じて特定のロボットアクションを抽象化する高レベルの命令でそのようなタスクを指定する可能性があります。長い実行期間にわたって言語とロボットのアクションの間のこのギャップを埋めるための鍵は、永続的な表現であることを提案します。永続的な空間意味表現法を提案し、それがどのようにして階層的推論を実行するエージェントを構築して長期的なタスクを効果的に実行できるかを示します。一般的に使用される段階的な手順を完全に回避しているにもかかわらず、ALFREDベンチマークでアプローチを評価し、最先端の結果を達成しています。
Natural language provides an accessible and expressive interface to specify long-term tasks for robotic agents. However, non-experts are likely to specify such tasks with high-level instructions, which abstract over specific robot actions through several layers of abstraction. We propose that key to bridging this gap between language and robot actions over long execution horizons are persistent representations. We propose a persistent spatial semantic representation method, and show how it enables building an agent that performs hierarchical reasoning to effectively execute long-term tasks. We evaluate our approach on the ALFRED benchmark and achieve state-of-the-art results, despite completely avoiding the commonly used step-by-step instructions.
updated: Tue Oct 19 2021 13:29:11 GMT+0000 (UTC)
published: Mon Jul 12 2021 17:47:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト