点群解析は、3D コンピューター ビジョンの基本的なタスクです。これまでの研究のほとんどは、データが適切に調整された合成データセットで実験を行ってきました。一方、現実世界の点群は事前に調整されていないことがよくあります。回転の不変性を実現する方法は、点群分析における未解決の問題のままです。この課題に対処するために、ローカル ジオメトリとグローバル トポロジを組み合わせることにより、回転不変 (RI) 表現を実現するための新しいアプローチを提案します。ローカル グローバル リプレゼンテーション (LGR)-Net では、1 つのストリームがローカル ジオメトリック RI 機能をエンコードし、もう 1 つのストリームがグローバル トポロジを保持する RI 機能をエンコードする 2 ブランチ ネットワークを設計しました。ローカル ジオメトリとグローバル トポロジは、さまざまな領域で異なるが補完的な RI 応答を持っているという観察に動機付けられ、2 ブランチ RI 機能は、革新的な多層パーセプトロン (MLP) ベースのアテンション モジュールによって融合されます。私たちの知る限り、この作業は、RI ポイント クラウド分析のコンテキストでグローバル情報とローカル情報を適応的に組み合わせるための最初の原則的なアプローチです。大規模な実験により、当社の LGR-Net が ModelNet40、ShapeNet、ScanObjectNN、および S3DIS のさまざまな回転拡張バージョンで最先端のパフォーマンスを達成することが実証されました。
Point cloud analysis is a fundamental task in 3D computer vision. Most previous works have conducted experiments on synthetic datasets with well-aligned data; while real-world point clouds are often not pre-aligned. How to achieve rotation invariance remains an open problem in point cloud analysis. To meet this challenge, we propose a novel approach toward achieving rotation-invariant (RI) representations by combining local geometry with global topology. In our local-global-representation (LGR)-Net, we have designed a two-branch network where one stream encodes local geometric RI features and the other encodes global topology-preserving RI features. Motivated by the observation that local geometry and global topology have different yet complementary RI responses in varying regions, two-branch RI features are fused by an innovative multi-layer perceptron (MLP) based attention module. To the best of our knowledge, this work is the first principled approach toward adaptively combining global and local information under the context of RI point cloud analysis. Extensive experiments have demonstrated that our LGR-Net achieves the state-of-the-art performance on various rotation-augmented versions of ModelNet40, ShapeNet, ScanObjectNN, and S3DIS.