3D点群の効率的なグラフ畳み込みのための球面カーネルを提案します。メトリックベースのカーネルは、ローカル3D空間を体系的に量子化して、データ内の特徴的な幾何学的関係を識別します。通常のグリッドCNNカーネルと同様に、球形カーネルは並進不変性と非対称性を維持します。前者はデータ内の類似のローカル構造間の重み共有を保証し、後者は精密な幾何学学習を促進します。提案されたカーネルは、エッジ依存フィルター生成なしでグラフニューラルネットワークに適用され、大きな点群に対して計算的に魅力的です。グラフネットワークでは、各頂点は単一のポイント位置に関連付けられ、エッジは定義された範囲内の近傍ポイントを接続します。グラフは、最も遠いポイントのサンプリングでネットワーク内で粗くなります。標準のCNNと同様に、ネットワークのプール操作とプール解除操作を定義します。 ModelNet、ShapeNet、RueMonge2014、ScanNet、およびS3DISデータセットを使用したポイントクラウド分類およびセマンティックセグメンテーションのためのグラフニューラルネットワークを使用して、提案された球面カーネルの有効性を示します。ソースコードとトレーニング済みモデルは、https://github.com/hlei-ziyan/SPH3D-GCNからダウンロードできます。
We propose a spherical kernel for efficient graph convolution of 3D point clouds. Our metric-based kernels systematically quantize the local 3D space to identify distinctive geometric relationships in the data. Similar to the regular grid CNN kernels, the spherical kernel maintains translation-invariance and asymmetry properties, where the former guarantees weight sharing among similar local structures in the data and the latter facilitates fine geometric learning. The proposed kernel is applied to graph neural networks without edge-dependent filter generation, making it computationally attractive for large point clouds. In our graph networks, each vertex is associated with a single point location and edges connect the neighborhood points within a defined range. The graph gets coarsened in the network with farthest point sampling. Analogous to the standard CNNs, we define pooling and unpooling operations for our network. We demonstrate the effectiveness of the proposed spherical kernel with graph neural networks for point cloud classification and semantic segmentation using ModelNet, ShapeNet, RueMonge2014, ScanNet and S3DIS datasets. The source code and the trained models can be downloaded from https://github.com/hlei-ziyan/SPH3D-GCN.