arXiv reaDer
PillarNet: リアルタイムで高性能な柱ベースの 3D オブジェクト検出
PillarNet: Real-Time and High-Performance Pillar-based 3D Object Detection
リアルタイムで高性能な 3D オブジェクト検出は、自動運転にとって非常に重要です。最近の最高性能の 3D オブジェクト検出器は、主にポイントベースまたは 3D ボクセルベースの畳み込みに依存していますが、どちらもオンボード展開には計算効率が悪いです。対照的に、ピラーベースの方法は 2D 畳み込みのみを使用するため、計算リソースの消費が少なくなりますが、ボクセルベースの方法よりも検出精度が大幅に遅れます。この論文では、ピラーベースの検出器とボクセルベースの検出器の間の主要なパフォーマンスギャップを調べることにより、リアルタイムで高性能のピラーベースの検出器、PillarNet を開発します。提案された PillarNet は、効果的なピラー機能のための強力なエンコーダネットワークで構成されています。学習、空間セマンティック機能融合のためのネック ネットワーク、および一般的に使用される検出ヘッド。 2D 畳み込みのみを使用する PillarNet は、オプションのピラー サイズに柔軟に対応し、VGGNet や ResNet などの従来の 2D CNN バックボーンと互換性があります。さらに、PillarNet は、IoU 対応の予測分岐とともに、設計された方向分離 IoU 回帰損失の恩恵を受けます。大規模な nuScenes データセットと Waymo オープン データセットに関する広範な実験結果は、提案された PillarNet が有効性と効率の点で最先端の 3D 検出器よりも優れていることを示しています。コードは https://github.com/agent-sgs/PillarNet で入手できます。
Real-time and high-performance 3D object detection is of critical importance for autonomous driving. Recent top-performing 3D object detectors mainly rely on point-based or 3D voxel-based convolutions, which are both computationally inefficient for onboard deployment. In contrast, pillar-based methods use solely 2D convolutions, which consume less computation resources, but they lag far behind their voxel-based counterparts in detection accuracy. In this paper, by examining the primary performance gap between pillar- and voxel-based detectors, we develop a real-time and high-performance pillar-based detector, dubbed PillarNet.The proposed PillarNet consists of a powerful encoder network for effective pillar feature learning, a neck network for spatial-semantic feature fusion and the commonly used detect head. Using only 2D convolutions, PillarNet is flexible to an optional pillar size and compatible with classical 2D CNN backbones, such as VGGNet and ResNet. Additionally, PillarNet benefits from our designed orientation-decoupled IoU regression loss along with the IoU-aware prediction branch. Extensive experimental results on the large-scale nuScenes Dataset and Waymo Open Dataset demonstrate that the proposed PillarNet performs well over state-of-the-art 3D detectors in terms of effectiveness and efficiency. Code is available at https://github.com/agent-sgs/PillarNet.
updated: Fri Aug 26 2022 03:21:15 GMT+0000 (UTC)
published: Mon May 16 2022 00:14:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト