投影された2D画像を通じて3D形状を認識するビューベースのアプローチにより、3D形状認識の最先端のパフォーマンスが実現しました。ビューベースのアプローチの重要な課題の1つは、2D画像から抽出されたマルチビューフィーチャを集約してグローバルな3D形状記述子にする方法です。この作業では、ビュー間の関係を完全に調査することにより、新しい機能集約ネットワークを提案します。ノードとしてマルチビュー画像を使用してリレーショナルグラフを構築し、ビュー間のペアワイズおよび隣接関係をモデル化することにより、リレーショナルグラフ埋め込みを設計します。グラフを徐々に粗くすることで、階層型リレーショナルグラフ埋め込みネットワーク(HRGE-Net)を構築し、マルチビュー機能を集約してグローバルな形状記述子にします。広範な実験により、HRGE-Netがベンチマークデータセットでの3D形状の分類と取得の最先端のパフォーマンスを達成することが示されています。
View-based approach that recognizes 3D shape through its projected 2D images achieved state-of-the-art performance for 3D shape recognition. One essential challenge for view-based approach is how to aggregate the multi-view features extracted from 2D images to be a global 3D shape descriptor. In this work, we propose a novel feature aggregation network by fully investigating the relations among views. We construct a relational graph with multi-view images as nodes, and design relational graph embedding by modeling pairwise and neighboring relations among views. By gradually coarsening the graph, we build a hierarchical relational graph embedding network (HRGE-Net) to aggregate the multi-view features to be a global shape descriptor. Extensive experiments show that HRGE-Net achieves stateof-the-art performance for 3D shape classification and retrieval on benchmark datasets.