3D形状表現とその処理は、3D形状認識に大きな影響を及ぼします。 3D形状表現としてのポリゴンメッシュには、コンピュータグラフィックスやジオメトリ処理において多くの利点があります。ただし、頂点とそのペアワイズ距離の次数と順列の変化を処理するなど、ポリゴンメッシュ表現に関する既存のディープニューラルネットワーク(DNN)ベースの方法にはまだいくつかの課題があります。これらの課題を克服するために、DNNベースの方法(PolyNet)と多重解像度構造を持つ特定のポリゴンメッシュ表現(PolyShape)を提案します。 PolyNetには2つの操作が含まれています。 (1)学習可能な係数を使用した多項式畳み込み(PolyConv)演算。畳み込みフィルターとして連続分布を学習し、異なる頂点間で重みを共有します。(2)PolyShapeの多重解像度構造を利用したポリゴンプーリング(PolyPool)手順はるかに低い次元で機能を集約します。私たちの実験は、既存のポリゴンメッシュベースの方法と比較した3D形状分類と検索タスクの両方におけるPolyNetの長所と利点、および画像のグラフ表現の分類におけるその優位性を示しています。コードはhttps://myavartanoo.github.io/polynet/から公開されています。
3D shape representation and its processing have substantial effects on 3D shape recognition. The polygon mesh as a 3D shape representation has many advantages in computer graphics and geometry processing. However, there are still some challenges for the existing deep neural network (DNN)-based methods on polygon mesh representation, such as handling the variations in the degree and permutations of the vertices and their pairwise distances. To overcome these challenges, we propose a DNN-based method (PolyNet) and a specific polygon mesh representation (PolyShape) with a multi-resolution structure. PolyNet contains two operations; (1) a polynomial convolution (PolyConv) operation with learnable coefficients, which learns continuous distributions as the convolutional filters to share the weights across different vertices, and (2) a polygonal pooling (PolyPool) procedure by utilizing the multi-resolution structure of PolyShape to aggregate the features in a much lower dimension. Our experiments demonstrate the strength and the advantages of PolyNet on both 3D shape classification and retrieval tasks compared to existing polygon mesh-based methods and its superiority in classifying graph representations of images. The code is publicly available from https://myavartanoo.github.io/polynet/.