arXiv reaDer
3Dポイントクラウドのセマンティックセグメンテーションのためのポイントアテンションネットワーク
Point Attention Network for Semantic Segmentation of 3D Point Clouds
  畳み込みニューラルネットワーク(CNN)は、画像などの規則的に配置されたグリッドで表されるデータに対して非常に優れたパフォーマンスを発揮しています。ただし、まばらな3D点群で従来の畳み込みカーネルまたはパラメーター共有メカニズムを直接活用することは、不規則で不規則な性質があるため非効率的です。 3Dポイントクラウドセマンティックセグメンテーションのために、豊富なローカル形状機能とそのコンテキスト相関を学習するポイントアテンションネットワークを提案します。近傍点の幾何分布は点の順序に不変であるため、多方向で検索された近傍点に基づいてローカルグラフを構築するために、ローカルアテンションエッジコンボリューション(LAE Conv)を提案します。各エッジに注意係数を割り当て、ポイントフィーチャをその隣接の重み付き合計として集約します。学習したLAE-Convレイヤーフィーチャは、ポイント単位の空間アテンションモジュールに渡され、距離に関係なくすべてのポイントの相互依存性マトリックスを生成します。これにより、より正確なセマンティック情報に寄与する長距離の空間コンテキストフィーチャがキャプチャされます。提案されたポイントアテンションネットワークは、LAE-Convレイヤーとポイント単位の空間アテンションモジュールと共に、3Dポイントクラウドセグメンテーションの高密度ラベルを予測するためのエンドツーエンドのトレーニング可能なネットワークとなるエンコーダーとデコーダーで構成されます。 3D点群の挑戦的なベンチマークの実験は、私たちのアルゴリズムが既存の最先端の方法と同等以上に実行できることを示しています。
Convolutional Neural Networks (CNNs) have performed extremely well on data represented by regularly arranged grids such as images. However, directly leveraging the classic convolution kernels or parameter sharing mechanisms on sparse 3D point clouds is inefficient due to their irregular and unordered nature. We propose a point attention network that learns rich local shape features and their contextual correlations for 3D point cloud semantic segmentation. Since the geometric distribution of the neighboring points is invariant to the point ordering, we propose a Local Attention-Edge Convolution (LAE Conv) to construct a local graph based on the neighborhood points searched in multi-directions. We assign attention coefficients to each edge and then aggregate the point features as a weighted sum of its neighbors. The learned LAE-Conv layer features are then given to a point-wise spatial attention module to generate an interdependency matrix of all points regardless of their distances, which captures long-range spatial contextual features contributing to more precise semantic information. The proposed point attention network consists of an encoder and decoder which, together with the LAE-Conv layers and the point-wise spatial attention modules, make it an end-to-end trainable network for predicting dense labels for 3D point cloud segmentation. Experiments on challenging benchmarks of 3D point clouds show that our algorithm can perform at par or better than the existing state of the art methods.
updated: Fri Sep 27 2019 13:00:03 GMT+0000 (UTC)
published: Fri Sep 27 2019 13:00:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト