arXiv reaDer
BEVDet:Bird-Eye-Viewでの高性能マルチカメラ3Dオブジェクト検出
BEVDet: High-performance Multi-camera 3D Object Detection in Bird-Eye-View
自動運転は、視覚認識における最も複雑なシナリオの1つである、意思決定のために周囲を認識します。 2Dオブジェクト検出タスクの解決におけるパラダイムの革新の成功は、この領域のパフォーマンスの限界を根本的に押し上げるための、エレガントで実行可能でスケーラブルなパラダイムを模索するように促します。この目的のために、このペーパーではBEVDetパラダイムに貢献します。 BEVDetは、Bird-Eye-View(BEV)で3Dオブジェクト検出を実行します。ここでは、ほとんどのターゲット値が定義されており、ルート計画を簡単に実行できます。既存のモジュールを再利用してフレームワークを構築するだけですが、排他的なデータ拡張戦略を構築し、非最大抑制戦略をアップグレードすることで、パフォーマンスを大幅に向上させます。実験では、BEVDetは精度と時間効率の間の優れたトレードオフを提供します。高速バージョンとして、BEVDet-TinyはnuScenes valセットで31.2%mAPと39.2%NDSを獲得します。 FCOS3Dと同等ですが、215.3 GFLOPの11%の計算バジェットが必要であり、15.6FPSで9.2倍高速に実行されます。 BEVDet-Baseと呼ばれる別の高精度バージョンは、39.3%mAPおよび47.2%NDSを記録し、公開されているすべての結果を大幅に上回っています。同等の推論速度で、FCOS3Dを+ 9.8%mAPおよび+ 10.0%NDSの大幅なマージンで上回っています。ソースコードは、https://github.com/HuangJunJie2017/BEVDetでさらに調査するために公開されています。
Autonomous driving perceives its surroundings for decision making, which is one of the most complex scenarios in visual perception. The success of paradigm innovation in solving the 2D object detection task inspires us to seek an elegant, feasible, and scalable paradigm for fundamentally pushing the performance boundary in this area. To this end, we contribute the BEVDet paradigm in this paper. BEVDet performs 3D object detection in Bird-Eye-View (BEV), where most target values are defined and route planning can be handily performed. We merely reuse existing modules to build its framework but substantially develop its performance by constructing an exclusive data augmentation strategy and upgrading the Non-Maximum Suppression strategy. In the experiment, BEVDet offers an excellent trade-off between accuracy and time-efficiency. As a fast version, BEVDet-Tiny scores 31.2% mAP and 39.2% NDS on the nuScenes val set. It is comparable with FCOS3D, but requires just 11% computational budget of 215.3 GFLOPs and runs 9.2 times faster at 15.6 FPS. Another high-precision version dubbed BEVDet-Base scores 39.3% mAP and 47.2% NDS, significantly exceeding all published results. With a comparable inference speed, it surpasses FCOS3D by a large margin of +9.8% mAP and +10.0% NDS. The source code is publicly available for further research at https://github.com/HuangJunJie2017/BEVDet .
updated: Thu Jun 16 2022 09:15:52 GMT+0000 (UTC)
published: Wed Dec 22 2021 10:48:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト