arXiv reaDer
DAIR-V2X:車両とインフラストラクチャの協調的な3Dオブジェクト検出のための大規模データセット
DAIR-V2X: A Large-Scale Dataset for Vehicle-Infrastructure Cooperative 3D Object Detection
自動運転は、グローバルな視点の欠如と長距離知覚能力の制限のために、大きな安全上の課題に直面しています。レベル5の自律性を達成するには、車両とインフラストラクチャの協力が必要であることが広く合意されています。ただし、コンピュータビジョンの研究者が車両とインフラストラクチャの連携に関連する問題に取り組むために利用できる実際のシナリオからのデータセットはまだありません。車両インフラストラクチャ協調自動運転(VICAD)のコンピュータビジョンの研究と革新を加速するために、VICADの実際のシナリオからの最初の大規模でマルチモダリティのマルチビューデータセットであるDAIR-V2Xデータセットをリリースします。 DAIR-V2Xは、71254 LiDARフレームと71254カメラフレームで構成され、すべてのフレームは3D注釈付きの実際のシーンからキャプチャされます。車両インフラストラクチャ協調3Dオブジェクト検出問題(VIC3D)が導入され、車両とインフラストラクチャの両方からの感覚入力を使用して3Dオブジェクトを共同で特定および識別する問題が定式化されます。従来の3Dオブジェクト検出の問題を解決することに加えて、VIC3Dのソリューションでは、車両とインフラストラクチャセンサー間の時間的非同期問題とそれらの間のデータ伝送コストを考慮する必要があります。さらに、DAIR-V2Xに基づくベンチマークとして、VIC3DタスクのレイトフュージョンフレームワークであるTime Compensation Late Fusion(TCLF)を提案します。 https://thudair.baai.ac.cn/indexおよびhttps://github.com/AIR-THU/DAIR-V2Xで、データ、コード、およびその他の最新情報を検索してください。
Autonomous driving faces great safety challenges for a lack of global perspective and the limitation of long-range perception capabilities. It has been widely agreed that vehicle-infrastructure cooperation is required to achieve Level 5 autonomy. However, there is still NO dataset from real scenarios available for computer vision researchers to work on vehicle-infrastructure cooperation-related problems. To accelerate computer vision research and innovation for Vehicle-Infrastructure Cooperative Autonomous Driving (VICAD), we release DAIR-V2X Dataset, which is the first large-scale, multi-modality, multi-view dataset from real scenarios for VICAD. DAIR-V2X comprises 71254 LiDAR frames and 71254 Camera frames, and all frames are captured from real scenes with 3D annotations. The Vehicle-Infrastructure Cooperative 3D Object Detection problem (VIC3D) is introduced, formulating the problem of collaboratively locating and identifying 3D objects using sensory inputs from both vehicle and infrastructure. In addition to solving traditional 3D object detection problems, the solution of VIC3D needs to consider the temporal asynchrony problem between vehicle and infrastructure sensors and the data transmission cost between them. Furthermore, we propose Time Compensation Late Fusion (TCLF), a late fusion framework for the VIC3D task as a benchmark based on DAIR-V2X. Find data, code, and more up-to-date information at https://thudair.baai.ac.cn/index and https://github.com/AIR-THU/DAIR-V2X.
updated: Tue Apr 12 2022 07:13:33 GMT+0000 (UTC)
published: Tue Apr 12 2022 07:13:33 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト