自動運転および支援システムは、複雑な実世界のシナリオにおけるさまざまなオブジェクトの関係をモデル化および学習するために、交通および道路のシナリオからの注釈付きデータに依存しています。展開可能なディープ ラーニング アーキテクチャの準備とトレーニングには、モデルがさまざまなトラフィック シナリオに適合し、さまざまな状況に適応する必要があります。現在、既存のデータセットは大規模ではありますが、そのような多様性に欠けており、主に開発された都市に地理的に偏っています。インドなどのいくつかの発展途上国で見られる構造化されていない複雑な運転レイアウトは、オブジェクトの種類、密度、および場所のばらつきが大きいため、これらのモデルに課題をもたらします。このようなシナリオに対応するためのより良い研究を促進するために、新しいデータセット IDD-3D を構築します。これは、複数のカメラと LiDAR センサーからのマルチモーダル データで構成され、さまざまな交通シナリオで LiDAR フレームを駆動する 12k の注釈が付けられています。既存のデータセットとの統計的比較を通じてこのデータセットの必要性について説明し、複雑なレイアウトでの標準的な 3D オブジェクト検出および追跡タスクのベンチマークを強調します。 https://github.com/shubham1810/idd3d_kit.git で入手可能なコードとデータ
Autonomous driving and assistance systems rely on annotated data from traffic and road scenarios to model and learn the various object relations in complex real-world scenarios. Preparation and training of deploy-able deep learning architectures require the models to be suited to different traffic scenarios and adapt to different situations. Currently, existing datasets, while large-scale, lack such diversities and are geographically biased towards mainly developed cities. An unstructured and complex driving layout found in several developing countries such as India poses a challenge to these models due to the sheer degree of variations in the object types, densities, and locations. To facilitate better research toward accommodating such scenarios, we build a new dataset, IDD-3D, which consists of multi-modal data from multiple cameras and LiDAR sensors with 12k annotated driving LiDAR frames across various traffic scenarios. We discuss the need for this dataset through statistical comparisons with existing datasets and highlight benchmarks on standard 3D object detection and tracking tasks in complex layouts. Code and data available at https://github.com/shubham1810/idd3d_kit.git