arXiv reaDer
LiDAR ベースのオブジェクト検出におけるカリキュラム オブジェクト操作
Curricular Object Manipulation in LiDAR-based Object Detection
この論文では、カリキュラム オブジェクト操作 (COM) フレームワークを提案することにより、LiDAR ベースの 3D オブジェクト検出におけるカリキュラム学習の可能性を探ります。フレームワークは、カリキュラムのトレーニング戦略を損失設計と増強プロセスの両方に組み込みます。損失設計のために、オブジェクトレベルの困難を動的に予測し、トレーニング段階に基づいてさまざまな困難のオブジェクトを強調する COMLoss を提案します。 LiDAR 検出タスクで広く使用されている GT-Aug と呼ばれる拡張技術に加えて、適切に設計されたヒューリスティックに基づいてグラウンド トゥルース データベース内のオブジェクトを最初にクラスター化する新しい COMAug 戦略を提案します。安定した結果を得るために、トレーニング中に個別の問題ではなくグループレベルの問題が予測および更新されます。モデルのパフォーマンスと一般化機能は、より困難なオブジェクトをサンプリングしてトレーニング サンプルに徐々に追加することで改善できます。広範な実験とアブレーション研究により、提案されたフレームワークの優れた一般性が明らかになりました。コードは https://github.com/ZZY816/COM で入手できます。
This paper explores the potential of curriculum learning in LiDAR-based 3D object detection by proposing a curricular object manipulation (COM) framework. The framework embeds the curricular training strategy into both the loss design and the augmentation process. For the loss design, we propose the COMLoss to dynamically predict object-level difficulties and emphasize objects of different difficulties based on training stages. On top of the widely-used augmentation technique called GT-Aug in LiDAR detection tasks, we propose a novel COMAug strategy which first clusters objects in ground-truth database based on well-designed heuristics. Group-level difficulties rather than individual ones are then predicted and updated during training for stable results. Model performance and generalization capabilities can be improved by sampling and augmenting progressively more difficult objects into the training samples. Extensive experiments and ablation studies reveal the superior and generality of the proposed framework. The code is available at https://github.com/ZZY816/COM.
updated: Sun Apr 09 2023 14:49:02 GMT+0000 (UTC)
published: Sun Apr 09 2023 14:49:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト