arXiv reaDer
深層強化学習
Deep Reinforcement Learning
深層強化学習を概観形式で論じます。詳細を詰め込んだ全体像を描きます。6つのコア要素、6つの重要なメカニズム、12のアプリケーションについて、現代の仕事に焦点を当て、歴史的な文脈の中で議論します。まず、人工知能、機械学習、深層学習、強化学習(RL)の背景について、リソースを交えて説明します。次に、RLのコア要素である、価値関数、ポリシー、報酬、モデル、探索対搾取、表現について議論します。次に、注意と記憶、教師なし学習、階層型RL、マルチエージェントRL、リレーショナルRL、学習するための学習を含むRLの重要なメカニズムについて議論します。その後、ゲーム、ロボット工学、自然言語処理(NLP)、コンピュータビジョン、金融、経営管理、医療、教育、エネルギー、輸送、コンピュータシステム、科学、工学、芸術を含むRLの応用について議論します。最後に簡単にまとめ、課題と機会について議論し、エピローグで締めくくります。
We discuss deep reinforcement learning in an overview style. We draw a big picture, filled with details. We discuss six core elements, six important mechanisms, and twelve applications, focusing on contemporary work, and in historical contexts. We start with background of artificial intelligence, machine learning, deep learning, and reinforcement learning (RL), with resources. Next we discuss RL core elements, including value function, policy, reward, model, exploration vs. exploitation, and representation. Then we discuss important mechanisms for RL, including attention and memory, unsupervised learning, hierarchical RL, multi-agent RL, relational RL, and learning to learn. After that, we discuss RL applications, including games, robotics, natural language processing (NLP), computer vision, finance, business management, healthcare, education, energy, transportation, computer systems, and, science, engineering, and art. Finally we summarize briefly, discuss challenges and opportunities, and close with an epilogue.
updated: Mon Oct 15 2018 13:20:56 GMT+0000 (UTC)
published: Mon Oct 15 2018 13:20:56 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト