Learning an Effective Equivariant 3D Descriptor Without Supervision
  3D形状間の対応を確立することは、3Dコンピュータービジョンの基本的なタスクであり、通常は一致するローカル記述子によって対処されます。最近、ディープラーニングパラダイムをタスクに適用するいくつかの試みが有望な結果を示しています。それでも、回転不変記述子を学習する唯一の方法は、既存の手作りの記述子によって提供される高度に設計された不変の表現をニューラルネットワークに供給することでした。 2Dイメージ用に正常にデプロイされました。このホワイトペーパーでは、方向性のない入力データから学習できる堅牢で特徴的な回転等変表現の作成を解きほぐすことで、3D記述子のエンドツーエンド学習の方向に一歩戻ることの利点を探りますテスト時にのみ不変記述子を取得するために必要な、適切な標準方向の定義。この目的のために、2つの最新のイノベーションを活用します。球面畳み込みニューラルネットワークは、等変記述子を学習し、平面折りたたみデコーダは、監督なしで学習します。提案されたアプローチの有効性は、標準的なベンチマークで手作業で学習された記述子を上回ることにより実験的に検証されています。
Establishing correspondences between 3D shapes is a fundamental task in 3D Computer Vision, typically addressed by matching local descriptors. Recently, a few attempts at applying the deep learning paradigm to the task have shown promising results. Yet, the only explored way to learn rotation invariant descriptors has been to feed neural networks with highly engineered and invariant representations provided by existing hand-crafted descriptors, a path that goes in the opposite direction of end-to-end learning from raw data so successfully deployed for 2D images. In this paper, we explore the benefits of taking a step back in the direction of end-to-end learning of 3D descriptors by disentangling the creation of a robust and distinctive rotation equivariant representation, which can be learned from unoriented input data, and the definition of a good canonical orientation, required only at test time to obtain an invariant descriptor. To this end, we leverage two recent innovations: spherical convolutional neural networks to learn an equivariant descriptor and plane folding decoders to learn without supervision. The effectiveness of the proposed approach is experimentally validated by outperforming hand-crafted and learned descriptors on a standard benchmark.
updated: Sun Sep 15 2019 21:27:23 GMT+0000 (UTC)
published: Sun Sep 15 2019 21:27:23 GMT+0000 (UTC)
