arXiv reaDer
疎な時間的局所注意を使用した点群セグメンテーション
Point Cloud Segmentation Using Sparse Temporal Local Attention
点群は、自動運転車の知覚に使用される重要なモダリティであり、周囲の環境を確実に幾何学的に理解するための手段を提供します。ただし、自動運転車からのセンサー出力は本質的に一時的なものですが、3Dセマンティックセグメンテーションに点群シーケンスを利用する方法はまだ限られています。この論文では、以前の点群フレーム内のローカル近傍からの中間特徴を集約して、デコーダに豊富な時間的コンテキストを提供する、新しいスパース時間的ローカル注意(STELA)モジュールを提案します。スパースローカルネイバーフッドを使用すると、ポイントフィーチャに直接一致するものよりも柔軟に、ポイントクラウドフレーム全体で高価なグローバルアテンションを実行するものよりも効率的にフィーチャを収集できます。 SemanticKittiデータセットで64.3%の競争力のあるmIoUを達成し、アブレーション研究で単一フレームのベースラインを大幅に上回っています。
Point clouds are a key modality used for perception in autonomous vehicles, providing the means for a robust geometric understanding of the surrounding environment. However despite the sensor outputs from autonomous vehicles being naturally temporal in nature, there is still limited exploration of exploiting point cloud sequences for 3D seman-tic segmentation. In this paper we propose a novel Sparse Temporal Local Attention (STELA) module which aggregates intermediate features from a local neighbourhood in previous point cloud frames to provide a rich temporal context to the decoder. Using the sparse local neighbourhood enables our approach to gather features more flexibly than those which directly match point features, and more efficiently than those which perform expensive global attention over the whole point cloud frame. We achieve a competitive mIoU of 64.3% on the SemanticKitti dataset, and demonstrate significant improvement over the single-frame baseline in our ablation studies.
updated: Wed Dec 01 2021 06:00:50 GMT+0000 (UTC)
published: Wed Dec 01 2021 06:00:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト