CrowdFix: An Eyetracking Dataset of Real Life Crowd Videos
  人間の視覚的注意と顕著性を理解することは、視覚研究の不可欠な部分です。これに関連して、特に混雑したシーンのような特別なユースケースへの洞察のために、新鮮で多様なベンチマークデータセットが常に必要です。 (1)顕著性と群衆の背後にあるダイナミクスをレビューします。 (2)アイトラッキングを使用して、インターネットから収集した新しい群集ビデオのセット上に動的な人間の注視データセットを作成します。ビデオには、3つの異なる密度レベルに注釈が付けられています。 (3)最後に、データセットの最新の顕著性モデルを評価して、より堅牢な顕著性モデルの設計と作成の可能な改善を特定します。
Understanding human visual attention and saliency is an integral part of vision research. In this context, there is an ever-present need for fresh and diverse benchmark datasets, particularly for insight into special use cases like crowded scenes. We contribute to this end by: (1) reviewing the dynamics behind saliency and crowds. (2) using eye tracking to create a dynamic human eye fixation dataset over a new set of crowd videos gathered from the Internet. The videos are annotated into three distinct density levels. (3) Finally, we evaluate state-of-the-art saliency models on our dataset to identify possible improvements for the design and creation of a more robust saliency model.
updated: Wed Oct 09 2019 07:40:19 GMT+0000 (UTC)
published: Mon Oct 07 2019 05:43:49 GMT+0000 (UTC)
