arXiv reaDer
PartSLIP: 事前トレーニング済みの画像言語モデルによる 3D ポイント クラウドのローショット パーツ セグメンテーション
PartSLIP: Low-Shot Part Segmentation for 3D Point Clouds via Pretrained Image-Language Models
一般化可能な 3D パーツ セグメンテーションは重要ですが、ビジョンとロボティクスでは困難です。従来の教師あり方法によるディープ モデルのトレーニングには、詳細なパーツ アノテーションを含む大規模な 3D データセットが必要であり、収集にはコストがかかります。このホワイト ペーパーでは、オープン語彙の 2D 検出で優れたパフォーマンスを実現する事前トレーニング済みのイメージ言語モデル GLIP を活用して、3D 点群のロー ショット パーツ セグメンテーションの代替方法を検討します。ポイント クラウド レンダリングでの GLIP ベースのパーツ検出と、新しい 2D から 3D へのラベル リフティング アルゴリズムにより、豊富な知識を 2D から 3D に転送します。また、マルチビュー 3D 事前分布と少数ショット プロンプト チューニングを利用して、パフォーマンスを大幅に向上させます。 PartNet および PartNet-Mobility データセットの広範な評価により、私たちの方法が優れたゼロ ショット 3D パーツ セグメンテーションを可能にすることが示されています。私たちの少数ショットバージョンは、既存の少数ショットアプローチよりも大幅に優れているだけでなく、完全に監視された対応物と比較して非常に競争力のある結果を達成しています.さらに、大幅なドメイン ギャップなしで、iPhone でスキャンした点群にこの方法を直接適用できることを示します。
Generalizable 3D part segmentation is important but challenging in vision and robotics. Training deep models via conventional supervised methods requires large-scale 3D datasets with fine-grained part annotations, which are costly to collect. This paper explores an alternative way for low-shot part segmentation of 3D point clouds by leveraging a pretrained image-language model, GLIP, which achieves superior performance on open-vocabulary 2D detection. We transfer the rich knowledge from 2D to 3D through GLIP-based part detection on point cloud rendering and a novel 2D-to-3D label lifting algorithm. We also utilize multi-view 3D priors and few-shot prompt tuning to boost performance significantly. Extensive evaluation on PartNet and PartNet-Mobility datasets shows that our method enables excellent zero-shot 3D part segmentation. Our few-shot version not only outperforms existing few-shot approaches by a large margin but also achieves highly competitive results compared to the fully supervised counterpart. Furthermore, we demonstrate that our method can be directly applied to iPhone-scanned point clouds without significant domain gaps.
updated: Sat Dec 03 2022 06:59:01 GMT+0000 (UTC)
published: Sat Dec 03 2022 06:59:01 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト