arXiv reaDer
An initial attempt of combining visual selective attention with deep reinforcement learning
 視覚的注意は、知覚システムの機能選択メカニズムの手段として機能します。 Broadbentの選択的注意のリーキーフィルターモデルを動機として、そのようなメカニズムがどのように実装され、深層強化学習の学習プロセスに影響を与えるかを評価します。おもちゃの問題のキャッチに関するDQNの機能マップを視覚化して分析し、視覚的選択的注意と深い強化学習を組み合わせるアプローチを提案します。 Atariゲームで、オプティカルフローベースの注意とA2Cを実験します。実験結果は、視覚的な選択的注意が、テストされたゲームのサンプル効率の点で改善につながる可能性があることを示しています。注意とバッチ正規化の間の興味深い関係も発見されました。
Visual attention serves as a means of feature selection mechanism in the perceptual system. Motivated by Broadbent's leaky filter model of selective attention, we evaluate how such mechanism could be implemented and affect the learning process of deep reinforcement learning. We visualize and analyze the feature maps of DQN on a toy problem Catch, and propose an approach to combine visual selective attention with deep reinforcement learning. We experiment with optical flow-based attention and A2C on Atari games. Experiment results show that visual selective attention could lead to improvements in terms of sample efficiency on tested games. An intriguing relation between attention and batch normalization is also discovered.
updated: Thu Jun 18 2020 17:48:44 GMT+0000 (UTC)
published: Sun Nov 11 2018 12:22:44 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト