arXiv reaDer
Point2SpatialCapsule: Aggregating Features and Spatial Relationships of Local Regions on Point Clouds using Spatial-aware Capsules
  3D形状分析と理解において、点群上で直接識別形状表現を学習することは依然として困難です。最近の研究には通常3つのステップが含まれます:最初に点群をいくつかのローカル領域に分割し、次に各ローカル領域の対応する特徴を抽出し、最後にすべての個々のローカル領域の特徴を単純な最大プーリングを使用して形状表現としてグローバルな特徴に集約します。ただし、このようなプーリングベースの機能集約方法では、ローカル領域間の空間的関係が適切に考慮されていないため、識別形状表現を学習する能力が大幅に制限されます。この問題に対処するために、ポイントクラウド上の局所領域の特徴と空間関係を集約するためのPoint2SpatialCapsuleという名前の新しい深層学習ネットワークを提案します。これは、より識別的な形状表現を学習することを目的としています。従来の最大プーリングベースの機能集約ネットワークと比較して、Point2SpatialCapsuleは、ローカル領域の幾何学的特徴だけでなく、それらの間の空間的関係も明示的に学習できます。 2つのモジュールで構成されています。局所領域の無秩序の問題を解決するために、幾何学的特徴の集約という名前の最初のモジュールは、局所領域の特徴を学習可能なクラスター中心に集約するように設計され、元の3D空間から空間位置を明示的にエンコードします。空間リレーションシップアグリゲーションと呼ばれる2番目のモジュールは、このペーパーで開発された空間認識カプセルを使用して、クラスター化されたフィーチャとフィーチャスペースにおけるフィーチャ間の空間リレーションシップをさらに集約するために提案されます。以前のカプセルネットワークベースの方法と比較して、空間認識カプセルの機能ルーティングは、ポイントクラウドのローカル領域間のより差別的な空間関係を学習できます。これにより、機能クラスターを介してログ事前分布と空間位置の間の直接マッピングが確立されます。
Learning discriminative shape representation directly on point clouds is still challenging in 3D shape analysis and understanding. Recent studies usually involve three steps: first splitting a point cloud into some local regions, then extracting corresponding feature of each local region, and finally aggregating all individual local region features into a global feature as shape representation using simple max pooling. However, such pooling-based feature aggregation methods do not adequately take the spatial relationships between local regions into account, which greatly limits the ability to learn discriminative shape representation. To address this issue, we propose a novel deep learning network, named Point2SpatialCapsule, for aggregating features and spatial relationships of local regions on point clouds, which aims to learn more discriminative shape representation. Compared with traditional max-pooling based feature aggregation networks, Point2SpatialCapsule can explicitly learn not only geometric features of local regions but also spatial relationships among them. It consists of two modules. To resolve the disorder problem of local regions, the first module, named geometric feature aggregation, is designed to aggregate the local region features into the learnable cluster centers, which explicitly encodes the spatial locations from the original 3D space. The second module, named spatial relationship aggregation, is proposed for further aggregating clustered features and the spatial relationships among them in the feature space using the spatial-aware capsules developed in this paper. Compared to the previous capsule network based methods, the feature routing on the spatial-aware capsules can learn more discriminative spatial relationships among local regions for point clouds, which establishes a direct mapping between log priors and the spatial locations through feature clusters.
updated: Thu Aug 29 2019 02:54:31 GMT+0000 (UTC)
published: Thu Aug 29 2019 02:54:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト