arXiv reaDer
BEVHeight: ビジョンベースの道路脇の 3D オブジェクト検出のための堅牢なフレームワーク
BEVHeight: A Robust Framework for Vision-based Roadside 3D Object Detection
最新の自動運転システムは自車両センサーの認識方法の開発に焦点を当てていますが、インテリジェントな路傍カメラを活用して視覚範囲を超えて認識能力を拡張する代替アプローチを見落とす傾向があります。最先端のビジョン中心の鳥瞰図検出方法は、路側カメラでのパフォーマンスが劣ることを発見しました。これは、これらの方法が主にカメラの中心に関する深度の回復に焦点を当てているためです。この場合、車と地面の間の深度の差は、距離が増加するにつれて急速に縮小します。このホワイトペーパーでは、この問題に対処するために、BEVHeight と呼ばれるシンプルで効果的なアプローチを提案します。本質的に、ピクセル単位の深度を予測する代わりに、高さを地面に回帰させて距離にとらわれない定式化を達成し、カメラのみの認識方法の最適化プロセスを容易にします。路側カメラの一般的な 3D 検出ベンチマークでは、私たちの方法は、以前のすべての視覚中心の方法を大幅に上回っています。コードは https://github.com/ADLab-AutoDrive/BEVHeight で入手できます。
While most recent autonomous driving system focuses on developing perception methods on ego-vehicle sensors, people tend to overlook an alternative approach to leverage intelligent roadside cameras to extend the perception ability beyond the visual range. We discover that the state-of-the-art vision-centric bird's eye view detection methods have inferior performances on roadside cameras. This is because these methods mainly focus on recovering the depth regarding the camera center, where the depth difference between the car and the ground quickly shrinks while the distance increases. In this paper, we propose a simple yet effective approach, dubbed BEVHeight, to address this issue. In essence, instead of predicting the pixel-wise depth, we regress the height to the ground to achieve a distance-agnostic formulation to ease the optimization process of camera-only perception methods. On popular 3D detection benchmarks of roadside cameras, our method surpasses all previous vision-centric methods by a significant margin. The code is available at https://github.com/ADLab-AutoDrive/BEVHeight.
updated: Wed Mar 15 2023 10:18:53 GMT+0000 (UTC)
published: Wed Mar 15 2023 10:18:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト