arXiv reaDer
PTT:ポイントクラウドでの3D単一オブジェクトトラッキング用のポイントトラックトランスフォーマーモジュール
PTT: Point-Track-Transformer Module for 3D Single Object Tracking in Point Clouds
3D単一オブジェクトトラッキングは、ロボット工学にとって重要な問題です。この論文では、点群ベースの3D単一オブジェクト追跡のためのPoint-Track-Transformer(PTT)と呼ばれるトランスフォーマーモジュールを提案します。 PTTモジュールには、特徴の埋め込み、位置のエンコード、および自己注意の特徴の計算のための3つのブロックが含まれています。特徴の埋め込みは、類似したセマンティック情報がある場合に、特徴を埋め込みスペースの近くに配置することを目的としています。位置エンコードは、点群の座標を高次元の識別可能なフィーチャにエンコードするために使用されます。自己注意は、注意の重みを計算することにより、洗練された注意機能を生成します。さらに、PTTモジュールをオープンソースの最先端のメソッドP2Bに組み込んで、PTT-Netを構築しました。 KITTIデータセットでの実験により、PTT-Netが最先端を大幅に上回っていることが明らかになりました(約10%)。さらに、PTT-NetはNVIDIA 1080Ti GPUでリアルタイムパフォーマンス(〜40FPS)を達成できます。私たちのコードは、https://github.com/shanjiayao/PTTでロボット工学コミュニティ向けにオープンソース化されています。
3D single object tracking is a key issue for robotics. In this paper, we propose a transformer module called Point-Track-Transformer (PTT) for point cloud-based 3D single object tracking. PTT module contains three blocks for feature embedding, position encoding, and self-attention feature computation. Feature embedding aims to place features closer in the embedding space if they have similar semantic information. Position encoding is used to encode coordinates of point clouds into high dimension distinguishable features. Self-attention generates refined attention features by computing attention weights. Besides, we embed the PTT module into the open-source state-of-the-art method P2B to construct PTT-Net. Experiments on the KITTI dataset reveal that our PTT-Net surpasses the state-of-the-art by a noticeable margin (~10%). Additionally, PTT-Net could achieve real-time performance (~40FPS) on NVIDIA 1080Ti GPU. Our code is open-sourced for the robotics community at https://github.com/shanjiayao/PTT.
updated: Sat Aug 14 2021 03:24:10 GMT+0000 (UTC)
published: Sat Aug 14 2021 03:24:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト