自動運転車の世界的な人気の高まりに伴い、3Dオブジェクト検出などのさまざまなコンピュータービジョンタスクのベンチマークとトレーニングのために、現実世界のデータセットに挑戦する必要性が差し迫っています。既存のデータセットは、単純なシナリオを表すか、日中のデータのみを提供します。このペーパーでは、RGB画像とLiDARデータで構成され、シーン、時間、および天候の大幅な多様性を備えた新しい挑戦的なA * 3Dデータセットを紹介します。データセットは、高密度の画像(先駆的なKITTIデータセットの$ \ approx〜10 $倍以上)、重い閉塞、多数の夜間フレーム($ \ approx〜3 $倍のnuScenesデータセット)で構成され、既存のデータセットのギャップにより、自動運転の研究におけるタスクの境界を、より挑戦的な非常に多様な環境に押し上げます。データセットには、$ 39 \ text {K $フレーム、$ 7 $クラス、および$ 230 \ text {K $ 3Dオブジェクトアノテーションが含まれています。高密度、昼間/夜間などのさまざまな属性のA * 3Dデータセットに対する広範な3Dオブジェクト検出ベンチマーク評価により、実際の環境での3Dオブジェクト検出のトレーニングとテストの利点と制限に関する興味深い洞察が得られます。
With the increasing global popularity of self-driving cars, there is an immediate need for challenging real-world datasets for benchmarking and training various computer vision tasks such as 3D object detection. Existing datasets either represent simple scenarios or provide only day-time data. In this paper, we introduce a new challenging A*3D dataset which consists of RGB images and LiDAR data with significant diversity of scene, time, and weather. The dataset consists of high-density images ($\approx~10$ times more than the pioneering KITTI dataset), heavy occlusions, a large number of night-time frames ($\approx~3$ times the nuScenes dataset), addressing the gaps in the existing datasets to push the boundaries of tasks in autonomous driving research to more challenging highly diverse environments. The dataset contains $39\text{K$ frames, $7$ classes, and $230\text{K$ 3D object annotations. An extensive 3D object detection benchmark evaluation on the A*3D dataset for various attributes such as high density, day-time/night-time, gives interesting insights into the advantages and limitations of training and testing 3D object detection in real-world setting.