arXiv reaDer
epBRM:エンドポイントボックス回帰モジュールを使用した3Dオブジェクト検出の品質の向上
epBRM: Improving a Quality of 3D Object Detection using End Point Box Regression Module
生のLiDAR3Dポイントクラウドを使用して正確な3Dバウンディングボックスを予測するために設計されたエンドポイントボックス回帰モジュール(epBRM)を紹介します。提案されたepBRMは、一連の小さなネットワークで構築されており、計算が軽量です。私たちのアプローチは、より正確な3Dバウンディングボックス座標を予測することにより、3Dオブジェクト検出のパフォーマンスを向上させることができます。提案されたアプローチでは、検出パフォーマンスを向上させるために40分のトレーニングが必要です。さらに、epBRMは、最大20個のオブジェクトのネットワーク推論時間に12ミリ秒未満を課します。提案されたアプローチは、空間変換メカニズムを利用して、ボックス回帰タスクを単純化します。空間変換メカニズムをepBRMに採用することで、小規模なネットワークでの検出品質を向上させることができます。生のLiDAR3Dポイントクラウドに適用されるさまざまな空間変換メカニズムの効果の詳細な分析を行います。また、提案されたepBRMを、いくつかの最先端の3Dオブジェクト検出システムに適用して評価します。自動運転車の標準的な3Dオブジェクト検出ベンチマークであるKITTIデータセットでアプローチを評価します。提案されたepBRMは、グラウンドトゥルースバウンディングボックスと検出されたバウンディングボックスの間のオーバーラップを強化し、3Dオブジェクト検出を改善します。 KITTIテストサーバーで評価された提案された方法は、現在の最先端のアプローチよりも優れています。
We present an endpoint box regression module(epBRM), which is designed for predicting precise 3D bounding boxes using raw LiDAR 3D point clouds. The proposed epBRM is built with sequence of small networks and is computationally lightweight. Our approach can improve a 3D object detection performance by predicting more precise 3D bounding box coordinates. The proposed approach requires 40 minutes of training to improve the detection performance. Moreover, epBRM imposes less than 12ms to network inference time for up-to 20 objects. The proposed approach utilizes a spatial transformation mechanism to simplify the box regression task. Adopting spatial transformation mechanism into epBRM makes it possible to improve the quality of detection with a small sized network. We conduct in-depth analysis of the effect of various spatial transformation mechanisms applied on raw LiDAR 3D point clouds. We also evaluate the proposed epBRM by applying it to several state-of-the-art 3D object detection systems. We evaluate our approach on KITTI dataset, a standard 3D object detection benchmark for autonomous vehicles. The proposed epBRM enhances the overlaps between ground truth bounding boxes and detected bounding boxes, and improves 3D object detection. Our proposed method evaluated in KITTI test server outperforms current state-of-the-art approaches.
updated: Wed Dec 23 2020 23:06:28 GMT+0000 (UTC)
published: Fri Sep 27 2019 22:42:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト