DRINet: A Dual-Representation Iterative Learning Network for Point Cloud Segmentation
二重表現の反復学習による点群セグメンテーションのための斬新で柔軟なアーキテクチャを提示します。点群処理では、さまざまな表現に独自の長所と短所があります。したがって、順列やスケール不変などの独自の内部物理特性を維持しながら、点群データ構造を表す適切な方法を見つけることが基本的な問題です。そのため、特に大規模な点群に対して、特徴転送の柔軟性が高く、計算コストが低い、二重表現学習の基本的なネットワーク構造として機能するDRINetを提案します。 DRINetは主に、スパースポイント-ボクセル特徴抽出とスパースボクセル-ポイント特徴抽出と呼ばれる2つのモジュールで構成されています。これらの2つのモジュールを繰り返し利用することにより、2つの異なる表現間で機能を伝播できます。さらに、コンテキスト情報の伝播を改善するために、ポイントごとの局所性学習のための新しいマルチスケールプーリングレイヤーを提案します。私たちのネットワークは、高い実行時効率を維持しながら、いくつかのデータセットで点群の分類およびセグメンテーションタスクの最先端の結果を達成します。大規模な屋外シナリオの場合、私たちの方法は、フレームあたり62msのリアルタイム推論速度で、最先端の方法よりも優れています。
We present a novel and flexible architecture for point cloud segmentation with dual-representation iterative learning. In point cloud processing, different representations have their own pros and cons. Thus, finding suitable ways to represent point cloud data structure while keeping its own internal physical property such as permutation and scale-invariant is a fundamental problem. Therefore, we propose our work, DRINet, which serves as the basic network structure for dual-representation learning with great flexibility at feature transferring and less computation cost, especially for large-scale point clouds. DRINet mainly consists of two modules called Sparse Point-Voxel Feature Extraction and Sparse Voxel-Point Feature Extraction. By utilizing these two modules iteratively, features can be propagated between two different representations. We further propose a novel multi-scale pooling layer for pointwise locality learning to improve context information propagation. Our network achieves state-of-the-art results for point cloud classification and segmentation tasks on several datasets while maintaining high runtime efficiency. For large-scale outdoor scenarios, our method outperforms state-of-the-art methods with a real-time inference speed of 62ms per frame.
updated: Mon Aug 09 2021 13:23:54 GMT+0000 (UTC)
published: Mon Aug 09 2021 13:23:54 GMT+0000 (UTC)
