arXiv reaDer
Uni3D: マルチデータセット 3D オブジェクト検出のための統一ベースライン
Uni3D: A Unified Baseline for Multi-dataset 3D Object Detection
現在の 3D オブジェクト検出モデルは、単一のデータセット固有のトレーニングおよびテスト パラダイムに従っており、別のデータセットに直接展開すると、検出精度が大幅に低下することがよくあります。この論文では、複数のデータセットから統合された 3D 検出器をトレーニングするタスクについて説明します。これは困難な作業のように見えますが、これは主に、これらのデータセットが異なる LiDAR タイプとデータ取得基準によって引き起こされる実質的なデータレベルの違いと分類レベルの変動を示すためです。このような観察に触発されて、単純なデータレベルの修正操作と設計されたセマンティックレベルの結合および再結合モジュールを活用して、避けられないデータレベルと分類レベルの違いをそれぞれ軽減する Uni3D を提示します。私たちの方法はシンプルで、PV-RCNN や Voxel-RCNN などの多くの 3D オブジェクト検出ベースラインと簡単に組み合わせることができるため、複数の既製の 3D データセットから効果的に学習して、より差別的で一般化可能な表現を取得できます。 Waymo-nuScenes、nuScenes-KITTI、Waymo-KITTI、および Waymo-nuScenes-KITTI 統合を含む多くのデータセット統合設定で実験が行われています。彼らの結果は、Uni3D が単一のデータセットでトレーニングされた一連の個々の検出器を超えており、選択されたベースライン検出器よりもパラメーターが 1.04 倍増加していることを示しています。この作業は、知覚パフォーマンスの限界を押し広げるため、3D 汎化の研究を刺激するものと期待しています。
Current 3D object detection models follow a single dataset-specific training and testing paradigm, which often faces a serious detection accuracy drop when they are directly deployed in another dataset. In this paper, we study the task of training a unified 3D detector from multiple datasets. We observe that this appears to be a challenging task, which is mainly due to that these datasets present substantial data-level differences and taxonomy-level variations caused by different LiDAR types and data acquisition standards. Inspired by such observation, we present a Uni3D which leverages a simple data-level correction operation and a designed semantic-level coupling-and-recoupling module to alleviate the unavoidable data-level and taxonomy-level differences, respectively. Our method is simple and easily combined with many 3D object detection baselines such as PV-RCNN and Voxel-RCNN, enabling them to effectively learn from multiple off-the-shelf 3D datasets to obtain more discriminative and generalizable representations. Experiments are conducted on many dataset consolidation settings including Waymo-nuScenes, nuScenes-KITTI, Waymo-KITTI, and Waymo-nuScenes-KITTI consolidations. Their results demonstrate that Uni3D exceeds a series of individual detectors trained on a single dataset, with a 1.04x parameter increase over a selected baseline detector. We expect this work will inspire the research of 3D generalization since it will push the limits of perceptual performance.
updated: Mon Mar 13 2023 05:54:13 GMT+0000 (UTC)
published: Mon Mar 13 2023 05:54:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト