arXiv reaDer
MineDojo: インターネット規模の知識を備えたオープンエンドの具現化エージェントの構築
MineDojo: Building Open-Ended Embodied Agents with Internet-Scale Knowledge
自律型エージェントは、Atari ゲームや囲碁などの専門分野で大きな進歩を遂げました。しかし、彼らは通常、限られた手動で考えられた目的を持つ隔離された環境でタブラ・ラサを学習するため、幅広いタスクと能力にわたって一般化することができません.人間がオープン ワールドで継続的に学習し、適応する方法に着想を得て、私たちはジェネラリスト エージェントを構築するための 3 つの要素を提唱しています。1) 多数のタスクと目標をサポートする環境、2) マルチモーダルな知識の大規模なデータベース、3 ) 柔軟でスケーラブルなエージェント アーキテクチャ。人気の Minecraft ゲームに基づいて構築された新しいフレームワークである MineDojo を紹介します。このフレームワークは、何千もの多様なオープンエンド タスクを備えたシミュレーション スイートと、Minecraft のビデオ、チュートリアル、Wiki ページ、およびフォーラム ディスカッションを備えたインターネット規模のナレッジ ベースを特徴としています。 MineDojo のデータを使用して、事前にトレーニングされた大規模なビデオ言語モデルを学習報酬関数として活用する新しいエージェント学習アルゴリズムを提案します。私たちのエージェントは、自由形式の言語で指定されたさまざまな自由形式のタスクを、手動で設計された密な整形報酬なしで解決できます。シミュレーション スイート、ナレッジ ベース、アルゴリズム実装、事前トレーニング済みモデル (https://minedojo.org) をオープンソース化して、一般的に有能な具現化エージェントの目標に向けた研究を促進します。
Autonomous agents have made great strides in specialist domains like Atari games and Go. However, they typically learn tabula rasa in isolated environments with limited and manually conceived objectives, thus failing to generalize across a wide spectrum of tasks and capabilities. Inspired by how humans continually learn and adapt in the open world, we advocate a trinity of ingredients for building generalist agents: 1) an environment that supports a multitude of tasks and goals, 2) a large-scale database of multimodal knowledge, and 3) a flexible and scalable agent architecture. We introduce MineDojo, a new framework built on the popular Minecraft game that features a simulation suite with thousands of diverse open-ended tasks and an internet-scale knowledge base with Minecraft videos, tutorials, wiki pages, and forum discussions. Using MineDojo's data, we propose a novel agent learning algorithm that leverages large pre-trained video-language models as a learned reward function. Our agent is able to solve a variety of open-ended tasks specified in free-form language without any manually designed dense shaping reward. We open-source the simulation suite, knowledge bases, algorithm implementation, and pretrained models (https://minedojo.org) to promote research towards the goal of generally capable embodied agents.
updated: Tue Nov 22 2022 07:59:47 GMT+0000 (UTC)
published: Fri Jun 17 2022 15:53:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト