arXiv reaDer
エネルギーベースのモデルを使用した正確な3Dオブジェクト検出
Accurate 3D Object Detection using Energy-Based Models
自律型ロボットによる複雑な環境の安全なナビゲーションには、正確な3Dオブジェクト検出(3DOD)が不可欠です。ただし、まばらなLiDARデータに基づいて、雑然とした環境で正確な3Dバウンディングボックスを回帰することは、非常に困難な問題です。確率的回帰のための条件付きエネルギーベースモデル(EBM)の最近の進歩を調査することにより、このタスクに対処します。回帰にEBMを使用する方法は、画像内の2Dオブジェクト検出で優れたパフォーマンスを示していますが、これらの手法は3Dバウンディングボックスには直接適用できません。したがって、この作業では、EBMネットワークのコアモジュールとして機能する、3Dバウンディングボックス用の微分可能なプーリング演算子を設計します。さらに、この一般的なアプローチを最先端の3Dオブジェクト検出器SA-SSDに統合します。 KITTIデータセットでは、提案されたアプローチは、すべての3DODメトリックでSA-SSDベースラインを一貫して上回っており、高精度の3DODに対するEBMベースの回帰の可能性を示しています。コードはhttps://github.com/fregu856/ebms_3dodで入手できます。
Accurate 3D object detection (3DOD) is crucial for safe navigation of complex environments by autonomous robots. Regressing accurate 3D bounding boxes in cluttered environments based on sparse LiDAR data is however a highly challenging problem. We address this task by exploring recent advances in conditional energy-based models (EBMs) for probabilistic regression. While methods employing EBMs for regression have demonstrated impressive performance on 2D object detection in images, these techniques are not directly applicable to 3D bounding boxes. In this work, we therefore design a differentiable pooling operator for 3D bounding boxes, serving as the core module of our EBM network. We further integrate this general approach into the state-of-the-art 3D object detector SA-SSD. On the KITTI dataset, our proposed approach consistently outperforms the SA-SSD baseline across all 3DOD metrics, demonstrating the potential of EBM-based regression for highly accurate 3DOD. Code is available at https://github.com/fregu856/ebms_3dod.
updated: Tue Dec 08 2020 18:53:42 GMT+0000 (UTC)
published: Tue Dec 08 2020 18:53:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト