arXiv reaDer
Atari-HEAD:Atari Human Eye-Tracking and Demonstration Dataset
Atari-HEAD: Atari Human Eye-Tracking and Demonstration Dataset
  大規模な公共データセットは、現代の人工知能の複数の分野での研究に役立つことが示されています。人間のデータを必要とする意思決定研究の場合、高品質のデータセットは、共通の再現可能な標準を提供することにより、新しい方法の開発を促進する重要なベンチマークとして機能します。多くの人間の意思決定タスクでは、高いレベルのパフォーマンスを得るために視覚的な注意が必要です。したがって、眼球運動を測定することで、人間が意思決定タスクを解決するために使用する戦略に関する豊富な情報源を提供できます。ここでは、人間がアタリビデオゲームをプレイしている間に同時に記録された眼球運動を伴う、人間の行動の大規模で高品質のデータセットを提供します。このデータセットは、20種類のゲームからなる117時間のゲームプレイデータで構成されており、800万のアクションデモと3億2,800万の視線サンプルが含まれています。人間が半フレームごとにプレイする新しい形式のゲームプレイを紹介します。これにより、既知の人間の記録に匹敵するか、それよりも優れた、ほぼ最適なゲーム決定とゲームスコアが得られます。データセットの有用性を、人間の視線を予測し、人間が実演するアクションを模倣するという2つの単純なアプリケーションで実証します。データの品質は、両方のタスクで有望な結果につながります。さらに、学習した人間の視線モデルを使用して模倣学習に通知すると、ゲームのパフォーマンスが115%向上します。これらの結果は、意思決定モデルに人間の視覚的注意を組み込み、研究コミュニティに現在のデータセットの価値を示すことの重要性を強調するものとして解釈します。このデータセットの規模と質が、視覚的注意、模倣学習、強化学習の分野の研究者により多くの機会を提供できることを願っています。
Large-scale public datasets have been shown to benefit research in multiple areas of modern artificial intelligence. For decision-making research that requires human data, high-quality datasets serve as important benchmarks to facilitate the development of new methods by providing a common reproducible standard. Many human decision-making tasks require visual attention to obtain high levels of performance. Therefore, measuring eye movements can provide a rich source of information about the strategies that humans use to solve decision-making tasks. Here, we provide a large-scale, high-quality dataset of human actions with simultaneously recorded eye movements while humans play Atari video games. The dataset consists of 117 hours of gameplay data from a diverse set of 20 games, with 8 million action demonstrations and 328 million gaze samples. We introduce a novel form of gameplay, in which the human plays in a semi-frame-by-frame manner. This leads to near-optimal game decisions and game scores that are comparable or better than known human records. We demonstrate the usefulness of the dataset through two simple applications: predicting human gaze and imitating human demonstrated actions. The quality of the data leads to promising results in both tasks. Moreover, using a learned human gaze model to inform imitation learning leads to an 115\% increase in game performance. We interpret these results as highlighting the importance of incorporating human visual attention in models of decision making and demonstrating the value of the current dataset to the research community. We hope that the scale and quality of this dataset can provide more opportunities to researchers in the areas of visual attention, imitation learning, and reinforcement learning.
updated: Sat Sep 07 2019 20:17:17 GMT+0000 (UTC)
published: Fri Mar 15 2019 18:55:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト