arXiv reaDer
ゼロショットプランナーとしての言語モデル:具体化されたエージェントのための実用的な知識の抽出
Language Models as Zero-Shot Planners: Extracting Actionable Knowledge for Embodied Agents
大規模な言語モデル(LLM)によって学習された世界の知識を使用して、インタラクティブな環境で行動することはできますか?このホワイトペーパーでは、自然言語で表現された高レベルのタスク(「朝食を作る」など)を、選択された一連の実行可能な手順(「冷蔵庫を開ける」など)に基づいて行う可能性を調査します。以前の作業は、行動の仕方の明確な段階的な例から学ぶことに焦点を当てていましたが、驚くべきことに、事前にトレーニングされたLMが十分に大きく、適切に促された場合、高レベルのタスクを低レベルの計画に効果的に分解できることがわかりました。さらなる特訓。ただし、LLMによって単純に作成された計画は、多くの場合、許容されるアクションに正確にマッピングできません。既存のデモンストレーションを条件とし、計画を許容可能なアクションに意味的に変換する手順を提案します。最近のVirtualHome環境での評価では、結果のメソッドがLLMベースラインよりも実行可能性を大幅に向上させることが示されています。実施された人間による評価は、実行可能性と正確性の間のトレードオフを明らかにしますが、言語モデルから実用的な知識を抽出するための有望な兆候を示しています。 https://huangwl18.github.io/language-plannerのWebサイト
Can world knowledge learned by large language models (LLMs) be used to act in interactive environments? In this paper, we investigate the possibility of grounding high-level tasks, expressed in natural language (e.g. "make breakfast"), to a chosen set of actionable steps (e.g. "open fridge"). While prior work focused on learning from explicit step-by-step examples of how to act, we surprisingly find that if pre-trained LMs are large enough and prompted appropriately, they can effectively decompose high-level tasks into low-level plans without any further training. However, the plans produced naively by LLMs often cannot map precisely to admissible actions. We propose a procedure that conditions on existing demonstrations and semantically translates the plans to admissible actions. Our evaluation in the recent VirtualHome environment shows that the resulting method substantially improves executability over the LLM baseline. The conducted human evaluation reveals a trade-off between executability and correctness but shows a promising sign towards extracting actionable knowledge from language models. Website at https://huangwl18.github.io/language-planner
updated: Tue Jan 18 2022 18:59:45 GMT+0000 (UTC)
published: Tue Jan 18 2022 18:59:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト