Go Wider:グループコンボリューションによる点群分析のための効率的なニューラルネットワーク
Go Wider: An Efficient Neural Network for Point Cloud Analysis via Group Convolutions
  点群分析のパフォーマンスを向上させるために、多くの研究者は、不規則な点群上で積層型多層パーセプトロン(MLP)畳み込みを使用して、より深いニューラルネットワークを適用しています。ただし、高密度のMLPコンボリューションを大量のポイントに適用すると(自動運転アプリケーションなど)、メモリと計算が非効率になります。高性能で複雑さを軽減するために、ShufflePointNetと呼ばれるディープワイドニューラルネットワークを提案し、きめの細かいローカル機能を活用し、グループコンボリューションとチャネルシャッフル操作を使用して冗長性を削減します。ポイントクラウドの高次元フィーチャにMLPを直接適用する従来の操作とは異なり、モデルはフィーチャを事前にグループに分割することでより広くなり、特定の深さが小さい各グループはそれぞれのMLP操作のみを担当し、複雑さを軽減し、より有用な情報をエンコードします。その間、機能チャネルでグループをシャッフルすることでグループ間の通信を接続し、きめの細かい機能をキャプチャします。より広いニューラルネットワークのマルチブランチ法は、ポイントクラウドの特徴抽出にも有益であると主張しています。 ModelNet40データセットの形状分類タスクと、大規模データセットShapeNetパーツ、S3DIS、KITTIのセマンティックセグメンテーションタスクの広範な実験を紹介します。さらにアブレーション研究を実施し、モデルを他の最先端のアルゴリズムと複雑さと精度の観点から比較します。
In order to achieve better performance for point cloud analysis, many researchers apply deeper neural networks using stacked Multi-Layer-Perceptron (MLP) convolutions over irregular point cloud. However, applying dense MLP convolutions over large amount of points (e.g. autonomous driving application) leads to inefficiency in memory and computation. To achieve high performance but less complexity, we propose a deep-wide neural network, called ShufflePointNet, to exploit fine-grained local features and reduce redundancy in parallel using group convolution and channel shuffle operation. Unlike conventional operation that directly applies MLPs on high-dimensional features of point cloud, our model goes wider by splitting features into groups in advance, and each group with certain smaller depth is only responsible for respective MLP operation, which can reduce complexity and allows to encode more useful information. Meanwhile, we connect communication between groups by shuffling groups in feature channel to capture fine-grained features. We claim that, multi-branch method for wider neural networks is also beneficial to feature extraction for point cloud. We present extensive experiments for shape classification task on ModelNet40 dataset and semantic segmentation task on large scale datasets ShapeNet part, S3DIS and KITTI. We further perform ablation study and compare our model to other state-of-the-art algorithms in terms of complexity and accuracy.
updated: Mon Sep 23 2019 15:39:46 GMT+0000 (UTC)
published: Mon Sep 23 2019 15:39:46 GMT+0000 (UTC)
