LiDARポイントクラウドからの3Dオブジェクト検出は、3Dシーンの理解において困難な問題であり、多くの実用的なアプリケーションがあります。この記事では、予備作業PointRCNNを、新規で強力なポイントクラウドベースの3Dオブジェクト検出フレームワーク、パート認識および集約ニューラルネットワーク(Part-A ^ 2 net)に拡張します。フレームワーク全体は、部分対応ステージと部分集約ステージで構成されています。まず、パートアウェアステージでは、3Dグラウンドトゥルースボックスから派生した無料のパーツ監視を完全に活用して、高品質の3D提案と正確なオブジェクト内パーツの位置を同時に予測します。同じプロポーザル内の予測されるオブジェクト内部品の位置は、新しい設計のRoI対応ポイントクラウドプーリングモジュールによってグループ化され、各3Dプロポーザルのジオメトリ固有の機能をエンコードするための効果的な表現になります。次に、パーツ集約ステージは、プールされたオブジェクト内パーツ位置の空間的関係を調査することにより、ボックスを再スコアリングし、ボックス位置を調整することを学習します。提案されたフレームワークの各コンポーネントのパフォーマンスの改善を実証するために、広範な実験が実施されています。当社のPart-A ^ 2ネットは、既存のすべての3D検出方法よりも優れており、LiDARポイントクラウドデータのみを利用することで、KITTI 3Dオブジェクト検出データセットの最新技術を実現しています。コードはhttps://github.com/sshaoshuai/PointCloudDet3Dで入手できます。
3D object detection from LiDAR point cloud is a challenging problem in 3D scene understanding and has many practical applications. In this paper, we extend our preliminary work PointRCNN to a novel and strong point-cloud-based 3D object detection framework, the part-aware and aggregation neural network (Part-A^2 net). The whole framework consists of the part-aware stage and the part-aggregation stage. Firstly, the part-aware stage for the first time fully utilizes free-of-charge part supervisions derived from 3D ground-truth boxes to simultaneously predict high quality 3D proposals and accurate intra-object part locations. The predicted intra-object part locations within the same proposal are grouped by our new-designed RoI-aware point cloud pooling module, which results in an effective representation to encode the geometry-specific features of each 3D proposal. Then the part-aggregation stage learns to re-score the box and refine the box location by exploring the spatial relationship of the pooled intra-object part locations. Extensive experiments are conducted to demonstrate the performance improvements from each component of our proposed framework. Our Part-A^2 net outperforms all existing 3D detection methods and achieves new state-of-the-art on KITTI 3D object detection dataset by utilizing only the LiDAR point cloud data. Code is available at https://github.com/sshaoshuai/PointCloudDet3D.