arXiv reaDer
APPT : 3D 点群を理解するための非対称並列点変換器
APPT : Asymmetric Parallel Point Transformer for 3D Point Cloud Understanding
変圧器ベースのネットワークは、3D 点群の理解において印象的なパフォーマンスを達成しました。ただし、それらのほとんどは局所的な機能の集約に集中していますが、グローバルな依存関係を直接モデル化することを怠っているため、有効な受容野が制限されています。さらに、ローカル コンポーネントとグローバル コンポーネントをどのように効果的に組み込むかという課題も残っています。これらの問題に取り組むために、非対称並列点変圧器 (APPT) を提案します。具体的には、Global Pivot Attention を導入して、グローバルな特徴を抽出し、有効な受容野を拡大します。さらに、非対称並列構造を設計して、ローカル情報とグローバル情報を効果的に統合します。これらの設計と組み合わせることで、APPT はローカルの詳細な機能に焦点を当てながら、ネットワーク全体でグローバルに機能をキャプチャできます。広範な実験により、S3DIS での 3D セマンティック セグメンテーション、ModelNet40 での 3D 形状分類、ShapeNet での 3D パーツ セグメンテーションなど、3D 点群を理解するためのいくつかのベンチマークで、私たちの方法が従来の方法よりも優れており、最先端を達成していることが示されています。
Transformer-based networks have achieved impressive performance in 3D point cloud understanding. However, most of them concentrate on aggregating local features, but neglect to directly model global dependencies, which results in a limited effective receptive field. Besides, how to effectively incorporate local and global components also remains challenging. To tackle these problems, we propose Asymmetric Parallel Point Transformer (APPT). Specifically, we introduce Global Pivot Attention to extract global features and enlarge the effective receptive field. Moreover, we design the Asymmetric Parallel structure to effectively integrate local and global information. Combined with these designs, APPT is able to capture features globally throughout the entire network while focusing on local-detailed features. Extensive experiments show that our method outperforms the priors and achieves state-of-the-art on several benchmarks for 3D point cloud understanding, such as 3D semantic segmentation on S3DIS, 3D shape classification on ModelNet40, and 3D part segmentation on ShapeNet.
updated: Fri Mar 31 2023 06:11:02 GMT+0000 (UTC)
published: Fri Mar 31 2023 06:11:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト