arXiv reaDer
BADet:点群からの境界を意識した3Dオブジェクト検出
BADet: Boundary-Aware 3D Object Detection from Point Clouds
現在、既存の最先端の3Dオブジェクト検出器は2段階のパラダイムにあります。これらの方法は通常、2つのステップで構成されます。1)地域提案ネットワークを利用して、少数の高品質な提案をボトムアップ方式で提案します。 2)提案された領域のセマンティック機能のサイズを変更してプールし、RoIごとの表現を要約してさらに改良します。手順2)のこれらのRoIに関する表現は、後続の検出ヘッダーにフィードされると、個別に無相関エントリと見なされることに注意してください。それにもかかわらず、我々は、ステップ1)によって生成されたこれらの提案を、何らかの形でグラウンドトゥルースからオフセットし、潜在的な確率で密集して地元の近隣に出現していることを観察します。既存のネットワークが対応する情報補償メカニズムを欠いている一方で、提案が座標オフセットのためにその境界情報を大部分見捨てる場合、課題が発生します。本論文では、点群からの3D物体検出のためのBADetを提案する。具体的には、以前の作品のように各提案を個別に改良するのではなく、各提案を特定のカットオフしきい値内のグラフ構築のノードとして表し、ローカル近傍グラフの形式で提案を関連付け、オブジェクトの境界相関を明示的に活用します。さらに、軽量のRegion Feature Aggregation Moduleを考案して、ボクセル単位、ピクセル単位、およびポイント単位の機能を十分に活用し、受容野を拡張して、より有益なRoI単位の表現を実現します。広く使用されているKITTIデータセットと非常に困難なnuScenesデータセットの両方でBADetを検証します。 2021年4月17日の時点で、当社のBADetは、KITTI 3D検出リーダーボードで同等のパフォーマンスを達成し、KITTIBEV検出リーダーボードの車カテゴリの中程度の難易度で1位にランクされています。ソースコードはhttps://github.com/rui-qian/BADetで入手できます。
Currently, existing state-of-the-art 3D object detectors are in two-stage paradigm. These methods typically comprise two steps: 1) Utilize a region proposal network to propose a handful of high-quality proposals in a bottom-up fashion. 2) Resize and pool the semantic features from the proposed regions to summarize RoI-wise representations for further refinement. Note that these RoI-wise representations in step 2) are considered individually as uncorrelated entries when fed to following detection headers. Nevertheless, we observe these proposals generated by step 1) offset from ground truth somehow, emerging in local neighborhood densely with an underlying probability. Challenges arise in the case where a proposal largely forsakes its boundary information due to coordinate offset while existing networks lack corresponding information compensation mechanism. In this paper, we propose BADet for 3D object detection from point clouds. Specifically, instead of refining each proposal independently as previous works do, we represent each proposal as a node for graph construction within a given cut-off threshold, associating proposals in the form of local neighborhood graph, with boundary correlations of an object being explicitly exploited. Besides, we devise a lightweight Region Feature Aggregation Module to fully exploit voxel-wise, pixel-wise, and point-wise features with expanding receptive fields for more informative RoI-wise representations. We validate BADet both on widely used KITTI Dataset and highly challenging nuScenes Dataset. As of Apr. 17th, 2021, our BADet achieves on par performance on KITTI 3D detection leaderboard and ranks 1^st on Moderate difficulty of Car category on KITTI BEV detection leaderboard. The source code is available at https://github.com/rui-qian/BADet.
updated: Tue Jan 11 2022 12:56:18 GMT+0000 (UTC)
published: Wed Apr 21 2021 03:10:33 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト