arXiv reaDer
3D オブジェクト検出のための車両運動予測とフレームフュージョン
Frame Fusion with Vehicle Motion Prediction for 3D Object Detection
LiDAR ベースの 3D 検出では、履歴点群には将来の予測に役立つ豊富な時間情報が含まれています。同様に、履歴の検出は将来の検出に貢献する必要があります。本稿では、履歴フレームを融合することで三次元物体検出結果を向上させる検出強化手法FrameFusionを提案します。 FrameFusion では、履歴フレームを現在のフレームに「転送」し、密な境界ボックスに重み付けされた非最大抑制を適用して、ボックスが結合された融合フレームを取得します。フレームを「転送」するには、車両運動モデルを使用して、境界ボックスの将来の姿勢を推定します。ただし、一般的に使用される等速度モデルは車両の旋回時には当然機能しないため、この問題に対処するために 2 つの車両運動モデルを検討します。 Waymo Open Dataset では、当社の FrameFusion メソッドにより、さまざまな 3D 検出器のパフォーマンスが一貫して、無視できる遅延で車両レベル 2 APH の約 2 倍向上し、時間融合メソッド MPPNet のパフォーマンスがわずかに向上します。また、運動モデルの選択に関する広範な実験も行っています。
In LiDAR-based 3D detection, history point clouds contain rich temporal information helpful for future prediction. In the same way, history detections should contribute to future detections. In this paper, we propose a detection enhancement method, namely FrameFusion, which improves 3D object detection results by fusing history frames. In FrameFusion, we ''forward'' history frames to the current frame and apply weighted Non-Maximum-Suppression on dense bounding boxes to obtain a fused frame with merged boxes. To ''forward'' frames, we use vehicle motion models to estimate the future pose of the bounding boxes. However, the commonly used constant velocity model fails naturally on turning vehicles, so we explore two vehicle motion models to address this issue. On Waymo Open Dataset, our FrameFusion method consistently improves the performance of various 3D detectors by about 2 vehicle level 2 APH with negligible latency and slightly enhances the performance of the temporal fusion method MPPNet. We also conduct extensive experiments on motion model selection.
updated: Mon Jun 19 2023 04:57:53 GMT+0000 (UTC)
published: Mon Jun 19 2023 04:57:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト