この論文は、3D 点群から SE(3) 等変特徴を学習するための畳み込み構造を提案します。これは、点群データを処理するために広く使用されている畳み込み形式であるカーネル ポイント コンボリューション (KPConv) の等価バージョンとみなすことができます。既存の等変ネットワークと比較して、私たちの設計はシンプル、軽量、高速で、既存のタスク固有の点群学習パイプラインと簡単に統合できます。これらの望ましい特性は、グループ畳み込みと商表現を組み合わせることによって実現します。具体的には、単純化するために SO(3) を有限グループに離散化し、同時に SO(2) をスタビライザー サブグループとして使用して球面商特徴フィールドを形成し、計算を節約します。また、回転を区別する能力を維持するために球面特徴から SO(3) 特徴を復元する置換層も提案します。実験の結果、私たちの方法は、オブジェクトの分類、姿勢推定、キーポイントのマッチングなどのさまざまなタスクで同等またはそれ以上のパフォーマンスを達成しながら、メモリ消費量が大幅に少なく、既存の作業よりも高速に実行できることがわかりました。提案された方法は、点群に基づいた現実世界のアプリケーションのための等変モデルの開発を促進できます。
This paper proposes a convolution structure for learning SE(3)-equivariant features from 3D point clouds. It can be viewed as an equivariant version of kernel point convolutions (KPConv), a widely used convolution form to process point cloud data. Compared with existing equivariant networks, our design is simple, lightweight, fast, and easy to be integrated with existing task-specific point cloud learning pipelines. We achieve these desirable properties by combining group convolutions and quotient representations. Specifically, we discretize SO(3) to finite groups for their simplicity while using SO(2) as the stabilizer subgroup to form spherical quotient feature fields to save computations. We also propose a permutation layer to recover SO(3) features from spherical features to preserve the capacity to distinguish rotations. Experiments show that our method achieves comparable or superior performance in various tasks, including object classification, pose estimation, and keypoint-matching, while consuming much less memory and running faster than existing work. The proposed method can foster the development of equivariant models for real-world applications based on point clouds.