arXiv reaDer
DSPoint:高周波融合によるデュアルスケール点群認識
DSPoint: Dual-scale Point Cloud Recognition with High-frequency Fusion
点群処理は、その希薄さと不規則性のために困難な作業です。以前の作品では、ローカル機能アグリゲーターまたはグローバル幾何学的アーキテクチャのいずれかに繊細なデザインが導入されていますが、両方の利点を組み合わせたものはほとんどありません。ボクセルとポイントを同時に操作することでローカルグローバルな特徴を抽出するために、高周波融合によるデュアルスケールポイントクラウド認識(DSPoint)を提案します。ボクセルに畳み込みを適用し、点に注意を払うという従来の設計を逆にします。具体的には、デュアルスケール処理のチャネル次元を通じてポイントの特徴を解きほぐします。1つは細粒度のジオメトリ解析のためのポイントごとの畳み込み、もう1つは長距離構造探索のためのボクセルごとのグローバルな注意です。高周波座標情報を通信することによってスケール間クロスモダリティ相互作用を実行するローカルグローバルモダリティをブレンドするための機能アラインメントのための共注意融合モジュールを設計します。広く採用されているModelNet40、ShapeNet、およびS3DISでの実験とアブレーションは、DSPointの最先端のパフォーマンスを示しています。
Point cloud processing is a challenging task due to its sparsity and irregularity. Prior works introduce delicate designs on either local feature aggregator or global geometric architecture, but few combine both advantages. We propose Dual-Scale Point Cloud Recognition with High-frequency Fusion (DSPoint) to extract local-global features by concurrently operating on voxels and points. We reverse the conventional design of applying convolution on voxels and attention to points. Specifically, we disentangle point features through channel dimension for dual-scale processing: one by point-wise convolution for fine-grained geometry parsing, the other by voxel-wise global attention for long-range structural exploration. We design a co-attention fusion module for feature alignment to blend local-global modalities, which conducts inter-scale cross-modality interaction by communicating high-frequency coordinates information. Experiments and ablations on widely-adopted ModelNet40, ShapeNet, and S3DIS demonstrate the state-of-the-art performance of our DSPoint.
updated: Mon May 16 2022 02:22:01 GMT+0000 (UTC)
published: Fri Nov 19 2021 17:25:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト