LiDAR ポイント クラウドからの 3D オブジェクト検出における主な課題は、ネットワークの信頼性に影響を与えずにリアルタイム パフォーマンスを達成することです。言い換えれば、検出ネットワークはその予測について十分な自信を持っている必要があります。このホワイト ペーパーでは、低速のボクセル ベースのモデルでボクセライザーが機能するのと同じように、高速のピラー ベースのモデルで機能する高速の動的ボクセライザーを実装することにより、ネットワークの推論速度と精度を同時に向上させるソリューションを紹介します。さらに、予測されたオブジェクトを分類するための軽量の検出サブヘッド モデルを提案し、無視できる時間と計算コストでモデルの精度を大幅に向上させる、誤って検出されたオブジェクトを除外します。開発されたコードは、https://github.com/YoushaaMurhij/RVCDet で公開されています。
The main challenge in 3D object detection from LiDAR point clouds is achieving real-time performance without affecting the reliability of the network. In other words, the detecting network must be confident enough about its predictions. In this paper, we present a solution to improve network inference speed and precision at the same time by implementing a fast dynamic voxelizer that works on fast pillar-based models in the same way a voxelizer works on slow voxel-based models. In addition, we propose a lightweight detection sub-head model for classifying predicted objects and filter out false detected objects that significantly improves model precision in a negligible time and computing cost. The developed code is publicly available at: https://github.com/YoushaaMurhij/RVCDet.