arXiv reaDer
夜間のプロビデント車両検出のためのデータセット
A Dataset for Provident Vehicle Detection at Night
現在のオブジェクト検出では、アルゴリズムは、検出されるためにオブジェクトが直接見えることを要求します。しかし、人間として、私たちはそれぞれのオブジェクトによって引き起こされる視覚的な手がかりを直感的に使用して、その外観についてすでに推測しています。運転の文脈では、そのような手がかりは、日中は影になり、夜はしばしば光の反射になる可能性があります。この論文では、この直感的な人間の行動をコンピュータビジョンアルゴリズムにマッピングして、ヘッドライトによって引き起こされる光の反射だけから夜間に対向車を検出する方法の問題を研究します。そのために、夜の田舎の環境で346の異なるシーンから59746の注釈付きグレースケール画像を含む広範なオープンソースデータセットを提示します。これらの画像では、すべての対向車、対応するライトオブジェクト(ヘッドランプなど)、およびそれぞれの光の反射(ガードレールでの光の反射など)にラベルが付けられています。このコンテキストでは、データセットの特性と、光の反射などの視覚的な手がかりを客観的に説明する際の課題について説明します。タスクにアプローチするさまざまな方法についてさまざまなメトリックを提供し、最先端のカスタムオブジェクト検出モデルを最初のベンチマークとして使用して達成した結果を報告します。それで、私たちはコンピュータビジョン研究の新しい、これまで無視されてきた分野に注意を向け、より多くの研究者が問題に取り組むことを奨励し、それによって人間のパフォーマンスとコンピュータビジョンシステムの間のギャップをさらに埋めたいと思います。
In current object detection, algorithms require the object to be directly visible in order to be detected. As humans, however, we intuitively use visual cues caused by the respective object to already make assumptions about its appearance. In the context of driving, such cues can be shadows during the day and often light reflections at night. In this paper, we study the problem of how to map this intuitive human behavior to computer vision algorithms to detect oncoming vehicles at night just from the light reflections they cause by their headlights. For that, we present an extensive open-source dataset containing 59746 annotated grayscale images out of 346 different scenes in a rural environment at night. In these images, all oncoming vehicles, their corresponding light objects (e.g., headlamps), and their respective light reflections (e.g., light reflections on guardrails) are labeled. In this context, we discuss the characteristics of the dataset and the challenges in objectively describing visual cues such as light reflections. We provide different metrics for different ways to approach the task and report the results we achieved using state-of-the-art and custom object detection models as a first benchmark. With that, we want to bring attention to a new and so far neglected field in computer vision research, encourage more researchers to tackle the problem, and thereby further close the gap between human performance and computer vision systems.
updated: Thu May 27 2021 15:31:33 GMT+0000 (UTC)
published: Thu May 27 2021 15:31:33 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト