自動運転車には正確な位置特定が不可欠です。 LiDAR データを使用した屋外ローカリゼーションのタスクに初めてトランスフォーマーを使用する自己教師あり学習方法を提示します。 360^∘ LiDAR スキャンのスライスを再編成して、その軸特性を活用するプレテキスト タスクを提案します。 Slice Transformer と呼ばれる私たちのモデルは、スライスを体系的に処理しながらマルチヘッドアテンションを採用しています。私たちの知る限りでは、これは屋外の点群にマルチヘッド アテンションを活用した最初の例です。さらに、西オーストラリア州のパース市の大縮尺 LiDAR マップを提供する Perth-WA データセットを紹介します。 Perth-WA のローカリゼーション アノテーションが提供されています。提案されたローカライゼーション手法は、Perth-WA および Appollo-SouthBay データセットで徹底的に評価されます。また、ModelNet40 および ScanNN データセットを使用して、オブジェクト分類の一般的なダウンストリーム タスクに対する自己教師あり学習アプローチの有効性を確立します。コードと Perth-WA データは公開されます。
Precise localization is critical for autonomous vehicles. We present a self-supervised learning method that employs Transformers for the first time for the task of outdoor localization using LiDAR data. We propose a pre-text task that reorganizes the slices of a 360^∘ LiDAR scan to leverage its axial properties. Our model, called Slice Transformer, employs multi-head attention while systematically processing the slices. To the best of our knowledge, this is the first instance of leveraging multi-head attention for outdoor point clouds. We additionally introduce the Perth-WA dataset, which provides a large-scale LiDAR map of Perth city in Western Australia, covering ∼4km^2 area. Localization annotations are provided for Perth-WA. The proposed localization method is thoroughly evaluated on Perth-WA and Appollo-SouthBay datasets. We also establish the efficacy of our self-supervised learning approach for the common downstream task of object classification using ModelNet40 and ScanNN datasets. The code and Perth-WA data will be publicly released.