Learning Point Embeddings from Shape Repositories for Few-Shot Segmentation
  オンラインリポジトリでユーザーが生成した3Dシェイプには、サーフェス、プリミティブ、および多くの場合階層に配置されたそれらの幾何学的関係に関する豊富な情報が含まれています。このメタデータに存在する情報を反映する3D形状の表現を学習するためのフレームワークを提示し、セマンティックセグメンテーションタスクの改善された一般化につながることを示します。私たちのアプローチは、グループ化階層とタグデータを反映するように3Dポイントのベクトル表現を生成するポイント埋め込みネットワークです。主な課題は、データにノイズが多く、非常に変化しやすいことです。この目的のために、ツリー対応のメトリック学習アプローチを提示し、特に学習データが限られている場合、そのような学習埋め込みがセマンティックセグメンテーションタスクへの優れた転送を提供することを示します。私たちのアプローチは、ゼロからトレーニングされたネットワークと比較して、ShapeNetセマンティックセグメンテーションベンチマークで$ 8 $トレーニングサンプルで$ 10.2 \%$、$ 120 $トレーニングサンプルで相対エラーを$ 11.72 \%$削減します。タグデータを利用することにより、ゼロからトレーニングされたネットワークと比較して、8 $のトレーニング例で相対エラーが$ 12.8 \%$減少します。メタデータは自由に利用できるため、これらの改善には追加のラベリング費用はかかりません。
User generated 3D shapes in online repositories contain rich information about surfaces, primitives, and their geometric relations, often arranged in a hierarchy. We present a framework for learning representations of 3D shapes that reflect the information present in this meta data and show that it leads to improved generalization for semantic segmentation tasks. Our approach is a point embedding network that generates a vectorial representation of the 3D points such that it reflects the grouping hierarchy and tag data. The main challenge is that the data is noisy and highly variable. To this end, we present a tree-aware metric-learning approach and demonstrate that such learned embeddings offer excellent transfer to semantic segmentation tasks, especially when training data is limited. Our approach reduces the relative error by $10.2\%$ with $8$ training examples, by $11.72\%$ with $120$ training examples on the ShapeNet semantic segmentation benchmark, in comparison to the network trained from scratch. By utilizing tag data the relative error is reduced by $12.8\%$ with $8$ training examples, in comparison to the network trained from scratch. These improvements come at no additional labeling cost as the meta data is freely available.
