arXiv reaDer
Transformer を使用した 3D 点群オブジェクト追跡のための Point-BEV Fusion の探索
Exploring Point-BEV Fusion for 3D Point Cloud Object Tracking with Transformer
自動運転における LiDAR センサーの普及に伴い、3D オブジェクト トラッキングへの注目が高まっています。ポイント クラウド シーケンスでは、3D オブジェクト トラッキングは、オブジェクト テンプレートを指定して、連続するフレーム内のオブジェクトの位置と方向を予測することを目的としています。変圧器の成功に動機付けられて、変圧器操作の助けを借りて、高品質の 3D 追跡結果を粗から細かい方法で効率的に予測する Point Tracking TRansformer (PTTR) を提案します。 PTTR は 3 つの斬新なデザインで構成されています。 1) ランダム サンプリングの代わりに、関係認識サンプリングを設計して、サブサンプリング中に特定のテンプレートに関連するポイントを保持します。 2) テンプレートと検索領域間の効果的な特徴集約と特徴マッチングのための Point Relation Transformer を提案します。 3) 粗い追跡結果に基づいて、新しい予測精緻化モジュールを使用して、ローカル機能プーリングを通じて最終的に精緻化された予測を取得します。さらに、オブジェクトの動きをキャプチャする点群の鳥瞰図 (BEV) の好ましい特性に動機付けられて、PTTR++ という名前のより高度なフレームワークをさらに設計します。高品質の追跡結果を生成する効果。 PTTR++ は、低い計算オーバーヘッドで PTTR に加えて追跡パフォーマンスを大幅に向上させます。複数のデータセットに対する広範な実験により、提案されたアプローチが優れた3D追跡の精度と効率を達成することが示されています。
With the prevalence of LiDAR sensors in autonomous driving, 3D object tracking has received increasing attention. In a point cloud sequence, 3D object tracking aims to predict the location and orientation of an object in consecutive frames given an object template. Motivated by the success of transformers, we propose Point Tracking TRansformer (PTTR), which efficiently predicts high-quality 3D tracking results in a coarse-to-fine manner with the help of transformer operations. PTTR consists of three novel designs. 1) Instead of random sampling, we design Relation-Aware Sampling to preserve relevant points to the given template during subsampling. 2) We propose a Point Relation Transformer for effective feature aggregation and feature matching between the template and search region. 3) Based on the coarse tracking results, we employ a novel Prediction Refinement Module to obtain the final refined prediction through local feature pooling. In addition, motivated by the favorable properties of the Bird's-Eye View (BEV) of point clouds in capturing object motion, we further design a more advanced framework named PTTR++, which incorporates both the point-wise view and BEV representation to exploit their complementary effect in generating high-quality tracking results. PTTR++ substantially boosts the tracking performance on top of PTTR with low computational overhead. Extensive experiments over multiple datasets show that our proposed approaches achieve superior 3D tracking accuracy and efficiency.
updated: Wed Aug 10 2022 08:36:46 GMT+0000 (UTC)
published: Wed Aug 10 2022 08:36:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト