arXiv reaDer
UniDistill: 鳥瞰図での 3D オブジェクト検出のためのユニバーサルなクロスモダリティ知識抽出フレームワーク
UniDistill: A Universal Cross-Modality Knowledge Distillation Framework for 3D Object Detection in Bird's-Eye View
自動運転のための 3D 物体検出の分野では、マルチモダリティとシングルモダリティを含むセンサー ポートフォリオは多様で複雑です。マルチモーダル手法はシステムが複雑であり、シングルモーダル手法は精度が比較的低いため、それらの間のトレードオフをどのように行うかは困難です。この作業では、単一モダリティ検出器のパフォーマンスを向上させるために、普遍的なクロスモダリティ知識蒸留フレームワーク (UniDistill) を提案します。具体的には、トレーニング中に、UniDistill は教師と生徒検出器の両方の機能を鳥瞰図 (BEV) に投影します。これは、さまざまなモダリティのわかりやすい表現です。次に、前景の特徴をまばらに整列させるために 3 つの蒸留損失が計算され、推論中に追加のコストを導入することなく、学生が教師から学ぶのに役立ちます。 BEV のさまざまな検出器の同様の検出パラダイムを利用して、UniDistill は、LiDAR からカメラへ、カメラから LiDAR へ、融合から LiDAR へ、および融合からカメラへの蒸留パスを簡単にサポートします。さらに、3 つの蒸留損失は、位置合わせされていない背景情報の影響をフィルター処理し、異なるサイズのオブジェクト間のバランスをとって、蒸留効率を向上させることができます。 nuScenes での広範な実験は、UniDistill が学生検出器の mAP と NDS を 2.0% ~ 3.2% 効果的に改善することを示しています。
In the field of 3D object detection for autonomous driving, the sensor portfolio including multi-modality and single-modality is diverse and complex. Since the multi-modal methods have system complexity while the accuracy of single-modal ones is relatively low, how to make a tradeoff between them is difficult. In this work, we propose a universal cross-modality knowledge distillation framework (UniDistill) to improve the performance of single-modality detectors. Specifically, during training, UniDistill projects the features of both the teacher and the student detector into Bird's-Eye-View (BEV), which is a friendly representation for different modalities. Then, three distillation losses are calculated to sparsely align the foreground features, helping the student learn from the teacher without introducing additional cost during inference. Taking advantage of the similar detection paradigm of different detectors in BEV, UniDistill easily supports LiDAR-to-camera, camera-to-LiDAR, fusion-to-LiDAR and fusion-to-camera distillation paths. Furthermore, the three distillation losses can filter the effect of misaligned background information and balance between objects of different sizes, improving the distillation effectiveness. Extensive experiments on nuScenes demonstrate that UniDistill effectively improves the mAP and NDS of student detectors by 2.0%~3.2%.
updated: Mon Mar 27 2023 10:50:58 GMT+0000 (UTC)
published: Mon Mar 27 2023 10:50:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト