nuScenes: A multimodal dataset for autonomous driving
 自動車両技術の展開には、オブジェクトの堅牢な検出と追跡が不可欠です。画像ベースのベンチマークデータセットは、環境内のエージェントのオブジェクト検出、追跡、セグメンテーションなどのコンピュータービジョンタスクの開発を推進してきました。ただし、ほとんどの自動運転車は、カメラと、ライダーやレーダーなどの距離センサーを組み合わせて搭載しています。検出と追跡のための機械学習ベースの方法が普及しているため、距離センサーデータと画像を含むデータセットでそのような方法をトレーニングおよび評価する必要があります。この作品では、完全な360度の視野を持つ6台のカメラ、5台のレーダー、1台のLIDARの完全な自律型車両センサースイートを運ぶ最初のデータセットであるnuTonomyシーン(nuScenes)を紹介します。 nuScenesは1000シーンで構成され、それぞれ20秒の長さで、23クラスと8属性の3Dバウンディングボックスで完全に注釈が付けられています。これには、先駆的なKITTIデータセットの7倍の注釈と100倍の画像があります。新しい3D検出および追跡メトリックを定義します。また、LIDARおよび画像ベースの検出と追跡のベースラインだけでなく、慎重なデータセット分析も提供します。データ、開発キット、その他の情報はオンラインで入手できます。
Robust detection and tracking of objects is crucial for the deployment of autonomous vehicle technology. Image based benchmark datasets have driven development in computer vision tasks such as object detection, tracking and segmentation of agents in the environment. Most autonomous vehicles, however, carry a combination of cameras and range sensors such as lidar and radar. As machine learning based methods for detection and tracking become more prevalent, there is a need to train and evaluate such methods on datasets containing range sensor data along with images. In this work we present nuTonomy scenes (nuScenes), the first dataset to carry the full autonomous vehicle sensor suite: 6 cameras, 5 radars and 1 lidar, all with full 360 degree field of view. nuScenes comprises 1000 scenes, each 20s long and fully annotated with 3D bounding boxes for 23 classes and 8 attributes. It has 7x as many annotations and 100x as many images as the pioneering KITTI dataset. We define novel 3D detection and tracking metrics. We also provide careful dataset analysis as well as baselines for lidar and image based detection and tracking. Data, development kit and more information are available online.
updated: Tue May 05 2020 09:13:24 GMT+0000 (UTC)
published: Tue Mar 26 2019 17:19:56 GMT+0000 (UTC)
