arXiv reaDer
軽量の自己注意ベースのモデルによる階層的点群の符号化と復号化
Hierarchical Point Cloud Encoding and Decoding with Lightweight Self-Attention based Model
この論文では、点群データの表現学習のための階層的で軽量な自己注意ベースの符号化および復号化アーキテクチャであるSA-CNNを紹介します。提案されたSA-CNNは、畳み込みおよび転置された畳み込みスタックを導入して、順序付けされていない3Dポイント間のコンテキスト情報をキャプチャおよび生成します。従来の階層パイプラインに従って、エンコードプロセスはローカルからグローバルな方法で特徴を抽出し、デコードプロセスは粗いものから細かいものへの多重解像度段階で特徴と点群を生成します。 SA-CNNは、分類、パーツセグメンテーション、再構成、形状検索、教師なし分類など、幅広いアプリケーションに対応できることを示しています。 SA-CNNは、ベンチマークで最先端または同等のパフォーマンスを実現しながら、モデルの複雑さを他のモデルよりも数桁低く維持しています。定性的な結果の観点から、多段階の点群の再構築と剛体上の潜在的な歩行、および変形可能な非剛体の人間とロボットのモデルを視覚化します。
In this paper we present SA-CNN, a hierarchical and lightweight self-attention based encoding and decoding architecture for representation learning of point cloud data. The proposed SA-CNN introduces convolution and transposed convolution stacks to capture and generate contextual information among unordered 3D points. Following conventional hierarchical pipeline, the encoding process extracts feature in local-to-global manner, while the decoding process generates feature and point cloud in coarse-to-fine, multi-resolution stages. We demonstrate that SA-CNN is capable of a wide range of applications, namely classification, part segmentation, reconstruction, shape retrieval, and unsupervised classification. While achieving the state-of-the-art or comparable performance in the benchmarks, SA-CNN maintains its model complexity several order of magnitude lower than the others. In term of qualitative results, we visualize the multi-stage point cloud reconstructions and latent walks on rigid objects as well as deformable non-rigid human and robot models.
updated: Sun Feb 13 2022 21:10:06 GMT+0000 (UTC)
published: Sun Feb 13 2022 21:10:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト