arXiv reaDer
ESGN:高速3Dオブジェクト検出のための効率的なステレオジオメトリネットワーク
ESGN: Efficient Stereo Geometry Network for Fast 3D Object Detection
高速ステレオベースの3Dオブジェクト検出器は、最近大きな進歩を遂げました。ただし、精度の点で高精度ステレオベースの方法に大きく遅れをとっています。主な理由は、3D空間でのジオメトリ認識機能の表現が不十分なためであると主張します。この問題を解決するために、効率的なステレオジオメトリネットワーク(ESGN)を提案します。 ESGNの鍵は、効率的なジオメトリ認識機能生成(EGFG)モジュールです。私たちのEGFGモジュールは、最初にステレオ相関および再投影モジュールを使用してカメラ錐台空間にマルチスケールステレオボリュームを構築し、次にマルチスケールBEV投影および融合モジュールを使用して複数のジオメトリ認識機能を生成します。これらの2つのステップでは、複雑な集約ネットワークを使用せずに、識別可能なジオメトリ対応の特徴生成のために、深いマルチスケール情報融合を採用します。さらに、LiDARベースの検出器を使用したステレオ特徴学習をガイドするために、ジオメトリを意識した深い特徴蒸留スキームを紹介します。実験は、古典的なKITTIデータセットで実行されます。 KITTIテストセットでは、ESGNは62msでmAP_3dで5.14%高速の最先端の検出器YOLOStereo3Dを上回っています。私たちの知る限り、私たちのESGNは、精度と速度の間で最良のトレードオフを実現します。私たちの効率的なステレオジオメトリネットワークが、高速な3Dオブジェクト検出のためのより多くの可能な方向を提供できることを願っています。ソースコードが公開されます。
Fast stereo based 3D object detectors have made great progress recently. However, they lag far behind high-precision stereo based methods in accuracy. We argue that the main reason is due to the poor geometry-aware feature representation in 3D space. To solve this problem, we propose an efficient stereo geometry network (ESGN). The key in our ESGN is an efficient geometry-aware feature generation (EGFG) module. Our EGFG module first uses a stereo correlation and reprojection module to construct multi-scale stereo volumes in camera frustum space, second employs a multi-scale BEV projection and fusion module to generate multiple geometry-aware features. In these two steps, we adopt deep multi-scale information fusion for discriminative geometry-aware feature generation, without any complex aggregation networks. In addition, we introduce a deep geometry-aware feature distillation scheme to guide stereo feature learning with a LiDAR-based detector. The experiments are performed on the classical KITTI dataset. On KITTI test set, our ESGN outperforms the fast state-of-art-art detector YOLOStereo3D by 5.14% on mAP_3d at 62ms. To the best of our knowledge, our ESGN achieves a best trade-off between accuracy and speed. We hope that our efficient stereo geometry network can provide more possible directions for fast 3D object detection. Our source code will be released.
updated: Tue Apr 26 2022 04:03:25 GMT+0000 (UTC)
published: Sun Nov 28 2021 05:25:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト