arXiv reaDer
LLM-Planner: 大規模な言語モデルを使用した具体化されたエージェントのための少数ショットの根拠のある計画
LLM-Planner: Few-Shot Grounded Planning for Embodied Agents with Large Language Models
この研究は、自然言語の指示に従って、視覚的に認識された環境で複雑なタスクを完了することができる具現化されたエージェントに焦点を当てています。既存の方法は、適切なポリシーを学習するために大量の (命令、ゴールド トラジェクトリ) ペアに依存しています。データのコストが高く、サンプルの効率が悪いため、多くのタスクに対応でき、新しいタスクをすばやく学習できる汎用エージェントの開発が妨げられています。この作業では、GPT-3 などの大規模言語モデル (LLM) の力を利用して、具体化されたエージェントの少数ショット計画を実行する新しい方法、LLM-Planner を提案します。さらに、現在の環境に基づいた計画を生成するために、物理的な接地を使用して LLM を強化するシンプルかつ効果的な方法を提案します。 ALFRED データセットの実験では、ペアのトレーニング データの 0.5% 未満を使用しているにもかかわらず、完全なトレーニング データを使用してトレーニングされた最近のいくつかのベースラインよりも優れており、非常に競争力のある少数ショットのパフォーマンスを達成できることが示されています。既存の方法では、同じ数回のショット設定では、タスクをほとんど完了できません。私たちの仕事は、多くのタスクをすばやく学習できる、用途が広く、サンプル効率の高い具体化されたエージェントを開発するための扉を開きます。
This study focuses on embodied agents that can follow natural language instructions to complete complex tasks in a visually-perceived environment. Existing methods rely on a large amount of (instruction, gold trajectory) pairs to learn a good policy. The high data cost and poor sample efficiency prevents the development of versatile agents that are capable of many tasks and can learn new tasks quickly. In this work, we propose a novel method, LLM-Planner, that harnesses the power of large language models (LLMs) such as GPT-3 to do few-shot planning for embodied agents. We further propose a simple but effective way to enhance LLMs with physical grounding to generate plans that are grounded in the current environment. Experiments on the ALFRED dataset show that our method can achieve very competitive few-shot performance, even outperforming several recent baselines that are trained using the full training data despite using less than 0.5% of paired training data. Existing methods can barely complete any task successfully under the same few-shot setting. Our work opens the door for developing versatile and sample-efficient embodied agents that can quickly learn many tasks.
updated: Thu Dec 08 2022 05:46:32 GMT+0000 (UTC)
published: Thu Dec 08 2022 05:46:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト