arXiv reaDer
From Points to Parts: 3D Object Detection from Point Cloud with Part-aware and Part-aggregation Network
 LiDARポイントクラウドからの3Dオブジェクト検出は、3Dシーンの理解において困難な問題であり、多くの実用的なアプリケーションがあります。この記事では、予備作業PointRCNNを、新規で強力なポイントクラウドベースの3Dオブジェクト検出フレームワーク、パート認識および集約ニューラルネットワーク(Part-A ^ 2 net)に拡張します。フレームワーク全体は、部分対応ステージと部分集約ステージで構成されています。まず、パートアウェアステージでは、3Dグラウンドトゥルースボックスから派生した無料のパーツ監視を完全に活用して、高品質の3D提案と正確なオブジェクト内パーツの位置を同時に予測します。同じプロポーザル内の予測されるオブジェクト内部品の位置は、新しい設計のRoI対応ポイントクラウドプーリングモジュールによってグループ化され、各3Dプロポーザルのジオメトリ固有の機能をエンコードするための効果的な表現になります。次に、パーツ集約ステージは、プールされたオブジェクト内パーツ位置の空間的関係を調査することにより、ボックスを再スコアリングし、ボックス位置を調整することを学習します。提案されたフレームワークの各コンポーネントのパフォーマンスの改善を実証するために、広範な実験が実施されています。当社のPart-A ^ 2ネットは、既存のすべての3D検出方法よりも優れており、LiDARポイントクラウドデータのみを利用することで、KITTI 3Dオブジェクト検出データセットの最新技術を実現しています。コードはで入手できます。
3D object detection from LiDAR point cloud is a challenging problem in 3D scene understanding and has many practical applications. In this paper, we extend our preliminary work PointRCNN to a novel and strong point-cloud-based 3D object detection framework, the part-aware and aggregation neural network (Part-A^2 net). The whole framework consists of the part-aware stage and the part-aggregation stage. Firstly, the part-aware stage for the first time fully utilizes free-of-charge part supervisions derived from 3D ground-truth boxes to simultaneously predict high quality 3D proposals and accurate intra-object part locations. The predicted intra-object part locations within the same proposal are grouped by our new-designed RoI-aware point cloud pooling module, which results in an effective representation to encode the geometry-specific features of each 3D proposal. Then the part-aggregation stage learns to re-score the box and refine the box location by exploring the spatial relationship of the pooled intra-object part locations. Extensive experiments are conducted to demonstrate the performance improvements from each component of our proposed framework. Our Part-A^2 net outperforms all existing 3D detection methods and achieves new state-of-the-art on KITTI 3D object detection dataset by utilizing only the LiDAR point cloud data. Code is available at
updated: Mon Mar 16 2020 04:33:20 GMT+0000 (UTC)
published: Mon Jul 08 2019 15:19:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト