arXiv reaDer
MVTN:3D形状認識のためのマルチビュー変換ネットワーク
MVTN: Multi-View Transformation Network for 3D Shape Recognition
マルチビュー投影法は、3D形状認識で最先端のパフォーマンスに到達する能力を示しています。マルチビュー表現のほとんどの進歩は、さまざまなビューから情報を集約することを学習するプーリング手法に焦点を当てています。プーリング手法は、すべての形状に対してヒューリスティックに設定および修正される傾向があります。現在のマルチビュー手法のダイナミズムの欠如を回避するために、それらの視点を学ぶことを提案します。特に、3D形状認識に最適な視点を回帰するマルチビュー変換ネットワーク(MVTN)を紹介します。微分可能なレンダリングの進歩を活用することにより、当社のMVTNは、マルチビューネットワークでエンドツーエンドでトレーニングされ、3D形状分類用に最適化されています。 MVTNをさまざまなマルチビューアプローチにシームレスに統合して、追加のトレーニング監視なしで3D形状分類および形状検索のタスクで明確なパフォーマンスの向上を示すことができることを示します。さらに、当社のMVTNは、マルチビューネットワークを改善して、回転の堅牢性とModelNet40でのオブジェクト形状の取得において最先端のパフォーマンスを実現します。
Multi-view projection methods have shown the capability to reach state-of-the-art performance on 3D shape recognition. Most advances in multi-view representation focus on pooling techniques that learn to aggregate information from the different views, which tend to be heuristically set and fixed for all shapes. To circumvent the lack of dynamism of current multi-view methods, we propose to learn those viewpoints. In particular, we introduce a Multi-View Transformation Network (MVTN) that regresses optimal viewpoints for 3D shape recognition. By leveraging advances in differentiable rendering, our MVTN is trained end-to-end with any multi-view network and optimized for 3D shape classification. We show that MVTN can be seamlessly integrated into various multi-view approaches to exhibit clear performance gains in the tasks of 3D shape classification and shape retrieval without any extra training supervision. Furthermore, our MVTN improves multi-view networks to achieve state-of-the-art performance in rotation robustness and in object shape retrieval on ModelNet40.
updated: Thu Nov 26 2020 11:33:53 GMT+0000 (UTC)
published: Thu Nov 26 2020 11:33:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト