arXiv reaDer
3Dオブジェクト検出のための注意ベースの提案の改良
Attention-based Proposals Refinement for 3D Object Detection
3Dオブジェクト検出の最近の進歩は、ボクセルベースのRegion Proposal Networks(RPN)の改良段階を開発して、精度と効率のバランスをより良くすることによって実現されています。最先端のフレームワークで人気のあるアプローチは、提案または関心領域(ROI)をグリッドに分割し、グリッドの場所ごとに特徴を抽出してから、それらを合成してROI機能を形成することです。印象的なパフォーマンスを達成する一方で、そのようなアプローチには、専門家の知識を正しく調整する必要がある多くの手作りのコンポーネント(グリッドサンプリング、セットの抽象化など)が含まれます。このホワイトペーパーでは、ボクセルベースのRPNとVector Attentionで構成された改良段階で構成される、APRO3D-Netという名前のROI機能コンピューティングへのデータ駆動型アプローチを提案します。元のマルチヘッドアテンションとは異なり、Vector Attentionは、ポイントフィーチャ内のさまざまなチャネルにさまざまな重みを割り当てるため、プールされたポイントとROIの間のより高度な関係をキャプチャできます。 KITTI検証セットでの実験は、私たちの方法が、密接に関連する方法と比較して最小のパラメーターを持ち、NVIDIA V100GPUで15FPSの準リアルタイム推論速度を達成しながら、中程度の難易度でクラスCarに対して84.84APの競争力のあるパフォーマンスを達成することを示しています。コードはhttps://github.com/quan-dao/APRO3D-Netでリリースされています。
Recent advances in 3D object detection is made by developing the refinement stage for voxel-based Region Proposal Networks (RPN) to better strike the balance between accuracy and efficiency. A popular approach among state-of-the-art frameworks is to divide proposals, or Regions of Interest (ROI), into grids and extract feature for each grid location before synthesizing them to form ROI feature. While achieving impressive performances, such an approach involves a number of hand crafted components (e.g. grid sampling, set abstraction) which requires expert knowledge to be tuned correctly. This paper proposes a data-driven approach to ROI feature computing named APRO3D-Net which consists of a voxel-based RPN and a refinement stage made of Vector Attention. Unlike the original multi-head attention, Vector Attention assigns different weights to different channels within a point feature, thus being able to capture a more sophisticated relation between pooled points and ROI. Experiments on KITTI validation set show that our method achieves competitive performance of 84.84 AP for class Car at Moderate difficulty while having the least parameters compared to closely related methods and attaining a quasi-real time inference speed at 15 FPS on NVIDIA V100 GPU. The code is released in https://github.com/quan-dao/APRO3D-Net.
updated: Wed Jan 26 2022 13:03:12 GMT+0000 (UTC)
published: Tue Jan 18 2022 15:50:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト