arXiv reaDer
CASSPR: クロス アテンション シングル スキャン場所認識
CASSPR: Cross Attention Single Scan Place Recognition
点群 (LiDAR) に基づく場所認識は、自律ロボットや自動運転車にとって重要なコンポーネントです。現在の SOTA パフォーマンスは、ポイントベースまたはボクセルベースの構造を使用して蓄積された LiDAR サブマップで実現されます。ボクセルベースのアプローチは、複数のスケールにわたる空間コンテキストを適切に統合しますが、ポイントベースの手法のような局所的な精度は示しません。その結果、既存の方法では、まばらなシングルショット LiDAR スキャンでの微妙な幾何学的特徴のきめ細かいマッチングに苦労しています。これらの制限を克服するために、クロスアテンショントランスフォーマーを使用してポイントベースのアプローチとボクセルベースのアプローチを融合する方法としてCASSPRを提案します。 CASSPR は、低解像度で情報を抽出および集約するためのスパース ボクセル ブランチと、きめの細かいローカル情報を取得するためのポイントワイズ ブランチを活用します。 CASSPR は、一方のブランチからのクエリを使用して、もう一方のブランチの構造を照合しようとし、両方が点群の自己完結型記述子を抽出するようにします (一方のブランチが支配するのではなく) が、両方を使用して点群の出力グローバル記述子を通知します。広範な実験により、CASSPR がいくつかのデータセット (Oxford RobotCar、TUM、USyd) で最先端のものを大幅に上回っていることが示されています。たとえば、TUM データセットでは 85.6% の AR@1 を達成し、最も強力な以前のモデルを最大 15% 上回ります。私たちのコードは公開されています。
Place recognition based on point clouds (LiDAR) is an important component for autonomous robots or self-driving vehicles. Current SOTA performance is achieved on accumulated LiDAR submaps using either point-based or voxel-based structures. While voxel-based approaches nicely integrate spatial context across multiple scales, they do not exhibit the local precision of point-based methods. As a result, existing methods struggle with fine-grained matching of subtle geometric features in sparse single-shot Li- DAR scans. To overcome these limitations, we propose CASSPR as a method to fuse point-based and voxel-based approaches using cross attention transformers. CASSPR leverages a sparse voxel branch for extracting and aggregating information at lower resolution and a point-wise branch for obtaining fine-grained local information. CASSPR uses queries from one branch to try to match structures in the other branch, ensuring that both extract self-contained descriptors of the point cloud (rather than one branch dominating), but using both to inform the output global descriptor of the point cloud. Extensive experiments show that CASSPR surpasses the state-of-the-art by a large margin on several datasets (Oxford RobotCar, TUM, USyd). For instance, it achieves AR@1 of 85.6% on the TUM dataset, surpassing the strongest prior model by ~15%. Our code is publicly available.
updated: Tue Aug 29 2023 18:40:19 GMT+0000 (UTC)
published: Tue Nov 22 2022 19:18:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト