深層学習アプローチは、過去数年にわたってセマンティックセグメンテーションの分野で大きな進歩を遂げました。ただし、現在のほとんどのアプローチは2D画像空間で動作します。非構造化3D点群の直接的なセマンティックセグメンテーションは、未解決の研究課題です。最近提案されたPointNetアーキテクチャは、非構造化ポイントクラウド上で動作し、有望なセグメンテーション結果を達成できるという点で興味深い前進を示しています。ただし、入力ポイントをブロックのグリッドに分割し、そのような各ブロックを個別に処理します。このホワイトペーパーでは、このようなアーキテクチャを拡張して大規模な空間コンテキストを組み込む方法についての質問を調査します。 PointNetに基づいて構築し、3Dシーンで受容野を拡大する2つの拡張機能を提案します。屋内および屋外の挑戦的なデータセットに関する提案された戦略を評価し、両方のシナリオで改善された結果を示します。
Deep learning approaches have made tremendous progress in the field of semantic segmentation over the past few years. However, most current approaches operate in the 2D image space. Direct semantic segmentation of unstructured 3D point clouds is still an open research problem. The recently proposed PointNet architecture presents an interesting step ahead in that it can operate on unstructured point clouds, achieving encouraging segmentation results. However, it subdivides the input points into a grid of blocks and processes each such block individually. In this paper, we investigate the question how such an architecture can be extended to incorporate larger-scale spatial context. We build upon PointNet and propose two extensions that enlarge the receptive field over the 3D scene. We evaluate the proposed strategies on challenging indoor and outdoor datasets and show improved results in both scenarios.