arXiv reaDer
単眼3Dオブジェクト検出の事前トレーニングパラダイムを掘り下げる
Delving into the Pre-training Paradigm of Monocular 3D Object Detection
単眼3Dオブジェクト検出(M3OD)のラベルは、入手するのに費用がかかります。一方、実際のアプリケーションには通常、ラベルのないデータが多数存在します。事前トレーニングは、ラベルのないデータの知識を活用する効率的な方法です。ただし、M3ODの事前トレーニングパラダイムはほとんど研究されていません。この作業でこのギャップを埋めることを目指しています。この目的のために、最初に2つの観察結果を導き出します。(1)事前トレーニングタスクを考案するためのガイドラインは、ターゲットタスクの表現を模倣することです。 (2)深度推定と2Dオブジェクト検出の組み合わせは、有望なM3OD事前トレーニングベースラインです。その後、ガイドラインに従って、このベースラインをさらに改善するためのいくつかの戦略を提案します。これには、主に、ターゲットに基づく半高密度深度推定、キーポイントを意識した2Dオブジェクト検出、クラスレベルの損失調整が含まれます。開発されたすべての技術を組み合わせることで、得られた事前トレーニングフレームワークは、KITTI-3DとnuScenesの両方のベンチマークでM3ODパフォーマンスを大幅に向上させる事前トレーニングされたバックボーンを生成します。たとえば、DLA34バックボーンをナイーブなセンターベースのM3OD検出器に適用することにより、KITTI-3DテストセットのCarの中程度のAP_3D70スコアが18.71%向上し、nuScenes検証セットのNDSスコアが比較的40.41%向上します。 。
The labels of monocular 3D object detection (M3OD) are expensive to obtain. Meanwhile, there usually exists numerous unlabeled data in practical applications, and pre-training is an efficient way of exploiting the knowledge in unlabeled data. However, the pre-training paradigm for M3OD is hardly studied. We aim to bridge this gap in this work. To this end, we first draw two observations: (1) The guideline of devising pre-training tasks is imitating the representation of the target task. (2) Combining depth estimation and 2D object detection is a promising M3OD pre-training baseline. Afterwards, following the guideline, we propose several strategies to further improve this baseline, which mainly include target guided semi-dense depth estimation, keypoint-aware 2D object detection, and class-level loss adjustment. Combining all the developed techniques, the obtained pre-training framework produces pre-trained backbones that improve M3OD performance significantly on both the KITTI-3D and nuScenes benchmarks. For example, by applying a DLA34 backbone to a naive center-based M3OD detector, the moderate AP_3D70 score of Car on the KITTI-3D testing set is boosted by 18.71% and the NDS score on the nuScenes validation set is improved by 40.41% relatively.
updated: Wed Jun 15 2022 02:50:31 GMT+0000 (UTC)
published: Wed Jun 08 2022 03:01:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト