arXiv reaDer
インタラクティブなゲームプレイによる一般化可能な視覚的表現の学習
Learning Generalizable Visual Representations via Interactive Gameplay
ますます多くの研究が、人間の文化だけでなく、カメやワタリガラスを含むさまざまな動物種に蔓延している具体化されたゲームプレイが、創造的な問題解決、意思決定、社会化のための神経の柔軟性を開発する上で重要であることを示唆しています。人工的なエージェントに対する具体化されたゲームプレイの影響に関しては、比較的ほとんど知られていません。最近の仕事は抽象ゲームに堪能なエージェントを生み出しましたが、これらの環境は現実の世界から遠く離れているため、これらのエージェントは具体化された遊びの利点についてほとんど洞察を提供できません。かくれんぼなどの隠蔽ゲームは、普遍的にプレイされ、視点の取得、秘密保持、誤った信念の理解のコンテキストで、表現学習に対する具体化されたゲームプレイの影響を研究するための豊富な基盤を提供します。ここでは、かくれんぼの変形であるキャッシュを再生する具体化された敵対的強化学習エージェントが、忠実度の高いインタラクティブな環境で、オブジェクトの永続性、自由空間などの情報をエンコードする観察の一般化可能な表現を学習することを初めて示しました。と封じ込め。生物学的に動機付けられた学習戦略に近づくと、志向性と記憶によって強化されたエージェントの表現は、相互作用と遊びを通して開発されます。これらの結果は、視覚のファセットが相互作用を通じてどのように発達するかを研究するためのモデルとして機能し、人工エージェントによって学習されたものを評価するための実験的フレームワークを提供し、大規模で静的なデータセットから体験的でインタラクティブな表現学習に移行することの価値を示します。
A growing body of research suggests that embodied gameplay, prevalent not just in human cultures but across a variety of animal species including turtles and ravens, is critical in developing the neural flexibility for creative problem solving, decision making, and socialization. Comparatively little is known regarding the impact of embodied gameplay upon artificial agents. While recent work has produced agents proficient in abstract games, these environments are far removed from the real world and thus these agents can provide little insight into the advantages of embodied play. Hiding games, such as hide-and-seek, played universally, provide a rich ground for studying the impact of embodied gameplay on representation learning in the context of perspective taking, secret keeping, and false belief understanding. Here we are the first to show that embodied adversarial reinforcement learning agents playing Cache, a variant of hide-and-seek, in a high fidelity, interactive, environment, learn generalizable representations of their observations encoding information such as object permanence, free space, and containment. Moving closer to biologically motivated learning strategies, our agents' representations, enhanced by intentionality and memory, are developed through interaction and play. These results serve as a model for studying how facets of vision develop through interaction, provide an experimental framework for assessing what is learned by artificial agents, and demonstrates the value of moving from large, static, datasets towards experiential, interactive, representation learning.
updated: Thu Feb 25 2021 17:51:31 GMT+0000 (UTC)
published: Tue Dec 17 2019 18:57:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト