From Voxel to Point: IoU-guided 3D Object Detection for Point Cloud with Voxel-to-Point Decoder
この論文では、ボクセルからポイントへのデコーダーを備えた交差点オーバーユニオン(IoU)ガイド付き2ステージ3Dオブジェクト検出器を紹介します。すべての生のポイントから必要な情報を保持し、ボクセルベースのRegion Proposal Network(RPN)で高いボックスリコールを維持するために、マップビューフィーチャに加えてポイントフィーチャを抽出する残余ボクセルツーポイントデコーダを提案します。ボクセルベースのRPN。 3D関心領域(RoI)アライメントを使用して、オブジェクトの位置を正確に認識するために、フィーチャをトリミングしてプロポーザルボックスにアライメントします。 RoI-Aligned機能は、最終的にコーナージオメトリの埋め込みで集約され、ボックスの絞り込み段階で欠落している可能性のあるコーナー情報を提供できます。より適切なローカリゼーションの信頼性として、推定されたIoUを洗練された提案ボックスに合わせるためのシンプルで効率的な方法を提案します。 KITTIとWaymoOpen Datasetの包括的な実験は、私たちの方法が既存の方法に対して新しいアーキテクチャで大幅な改善を達成することを示しています。コードはGithubURLで入手できます。
In this paper, we present an Intersection-over-Union (IoU) guided two-stage 3D object detector with a voxel-to-point decoder. To preserve the necessary information from all raw points and maintain the high box recall in voxel based Region Proposal Network (RPN), we propose a residual voxel-to-point decoder to extract the point features in addition to the map-view features from the voxel based RPN. We use a 3D Region of Interest (RoI) alignment to crop and align the features with the proposal boxes for accurately perceiving the object position. The RoI-Aligned features are finally aggregated with the corner geometry embeddings that can provide the potentially missing corner information in the box refinement stage. We propose a simple and efficient method to align the estimated IoUs to the refined proposal boxes as a more relevant localization confidence. The comprehensive experiments on KITTI and Waymo Open Dataset demonstrate that our method achieves significant improvements with novel architectures against the existing methods. The code is available on Github URL
updated: Sun Aug 08 2021 14:30:13 GMT+0000 (UTC)
published: Sun Aug 08 2021 14:30:13 GMT+0000 (UTC)
