arXiv reaDer
深層強化学習の簡単な調査
A Brief Survey of Deep Reinforcement Learning
深層強化学習は、AIの分野に革命を起こす準備ができており、視覚世界をより高度に理解した自律的なシステムの構築に向けた一歩を示しています。現在、深層学習は、ピクセルから直接ビデオゲームをプレイすることを学習するなど、以前は難解だった問題を強化学習でスケーリングすることを可能にしています。また、深層強化学習アルゴリズムはロボット工学にも応用されており、現実世界のカメラ入力からロボットの制御方針を直接学習できるようになっています。本調査では、まず強化学習の一般的な分野の紹介から始まり、価値に基づいた手法と政策に基づいた手法の主要な流れへと進んでいきます。本調査では、深層強化学習の中心的なアルゴリズムである深層Qネットワーク、信頼領域政策最適化、非同期優位性アクター批判などを取り上げます。並行して、強化学習による視覚的理解に焦点を当て、ディープニューラルネットワークのユニークな利点を強調します。最後に、この分野におけるいくつかの現在の研究分野について述べます。
Deep reinforcement learning is poised to revolutionise the field of AI and represents a step towards building autonomous systems with a higher level understanding of the visual world. Currently, deep learning is enabling reinforcement learning to scale to problems that were previously intractable, such as learning to play video games directly from pixels. Deep reinforcement learning algorithms are also applied to robotics, allowing control policies for robots to be learned directly from camera inputs in the real world. In this survey, we begin with an introduction to the general field of reinforcement learning, then progress to the main streams of value-based and policy-based methods. Our survey will cover central algorithms in deep reinforcement learning, including the deep Q-network, trust region policy optimisation, and asynchronous advantage actor-critic. In parallel, we highlight the unique advantages of deep neural networks, focusing on visual understanding via reinforcement learning. To conclude, we describe several current areas of research within the field.
updated: Thu Sep 28 2017 21:51:43 GMT+0000 (UTC)
published: Sat Aug 19 2017 15:55:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト