arXiv reaDer
深層強化学習: 概要
Deep Reinforcement Learning: An Overview
深層強化学習(RL)の最近のエキサイティングな成果を概観します。6つのコア要素、6つの重要なメカニズム、12のアプリケーションについて論じます。まず、機械学習、深層学習、強化学習の背景について説明します。次に、価値関数、特にDeep Q-Network(DQN)、政策、報酬、モデル、計画、探索を含むRLのコア要素について議論します。その後、注意と記憶、教師なし学習、伝達学習、マルチエージェントRL、階層的RL、学習するための学習など、RLの重要なメカニズムについて議論します。その後、ゲーム、特にAlphaGo、ロボット工学、対話システム、機械翻訳、テキスト生成を含む自然言語処理、コンピュータビジョン、ニューラルアーキテクチャ設計、経営管理、金融、ヘルスケア、インダストリー4.0、スマートグリッド、インテリジェント交通システム、コンピュータシステムを含むRLの様々な応用について議論します。まだレビューされていないトピックに言及し、RLリソースのコレクションをリストアップします。簡単な要約を提示した後、議論をして締めくくります。重要な更新は、Deep Reinforcement Learning, arXiv:1810.06339をご覧ください。
We give an overview of recent exciting achievements of deep reinforcement learning (RL). We discuss six core elements, six important mechanisms, and twelve applications. We start with background of machine learning, deep learning and reinforcement learning. Next we discuss core RL elements, including value function, in particular, Deep Q-Network (DQN), policy, reward, model, planning, and exploration. After that, we discuss important mechanisms for RL, including attention and memory, unsupervised learning, transfer learning, multi-agent RL, hierarchical RL, and learning to learn. Then we discuss various applications of RL, including games, in particular, AlphaGo, robotics, natural language processing, including dialogue systems, machine translation, and text generation, computer vision, neural architecture design, business management, finance, healthcare, Industry 4.0, smart grid, intelligent transportation systems, and computer systems. We mention topics not reviewed yet, and list a collection of RL resources. After presenting a brief summary, we close with discussions. Please see Deep Reinforcement Learning, arXiv:1810.06339, for a significant update.
updated: Mon Nov 26 2018 04:56:31 GMT+0000 (UTC)
published: Wed Jan 25 2017 11:52:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト