arXiv reaDer
自動運転のためのステレオCenterNetベースの3Dオブジェクト検出
Stereo CenterNet based 3D Object Detection for Autonomous Driving
最近、ステレオ画像に基づく3次元(3D)検出が著しく進歩しました。ただし、ほとんどの高度な方法では、この問題に対処するために、アンカーベースの2次元(2D)検出または深度推定を採用しています。それにもかかわらず、高い計算コストは、これらの方法がリアルタイムのパフォーマンスを達成することを妨げます。本研究では、ステレオ画像の幾何学的情報を使用した3Dオブジェクト検出方法であるStereo CenterNet(SC)を提案します。 SCは、空間内のオブジェクトの3Dバウンディングボックスの4つのセマンティックキーポイントを予測し、2Dの左右のボックス、3Dの寸法、方向、およびキーポイントを利用して、3D空間内のオブジェクトのバウンディングボックスを復元します。その後、改良された測光アライメントモジュールを採用して、3Dバウンディングボックスの位置をさらに最適化します。 KITTIデータセットで実施された実験は、提案されたSCが、追加のデータを使用せずに、高度な方法の中で最高の速度と精度のトレードオフを示すことを示しています。
Recently, three-dimensional (3D) detection based on stereo images has progressed remarkably; however, most advanced methods adopt anchor-based two-dimensional (2D) detection or depth estimation to address this problem. Nevertheless, high computational cost inhibits these methods from achieving real-time performance. In this study, we propose a 3D object detection method, Stereo CenterNet (SC), using geometric information in stereo imagery. SC predicts the four semantic key points of the 3D bounding box of the object in space and utilizes 2D left and right boxes, 3D dimension, orientation, and key points to restore the bounding box of the object in the 3D space. Subsequently, we adopt an improved photometric alignment module to further optimize the position of the 3D bounding box. Experiments conducted on the KITTI dataset indicate that the proposed SC exhibits the best speed-accuracy trade-off among advanced methods without using extra data.
updated: Thu Sep 23 2021 08:50:58 GMT+0000 (UTC)
published: Sat Mar 20 2021 02:18:49 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト