arXiv reaDer
Objaverse-XL: 1,000 万以上の 3D オブジェクトの宇宙
Objaverse-XL: A Universe of 10M+ 3D Objects
自然言語処理と 2D ビジョン モデルは、主にトレーニング データの規模を拡大することにより、多くのタスクで目覚ましい熟練度を達成しました。しかし、高品質の 3D データを取得するという課題のせいで、3D ビジョンのタスクはそれほど進歩していません。この研究では、1,000 万を超える 3D オブジェクトのデータセットである Objaverse-XL を紹介します。私たちのデータセットは、手動で設計されたオブジェクト、ランドマークや日用品の写真測量スキャン、歴史的およびアンティークの遺物のプロによるスキャンなど、さまざまなソースから重複排除された 3D オブジェクトで構成されています。 3D データセットの分野で最大の規模と多様性を表す Objaverse-XL は、3D ビジョンの重要な新しい可能性を可能にします。私たちの実験では、Objaverse-XL によって提供されるスケールによって改善が可能になることが実証されています。 1 億を超えるマルチビュー レンダリング イメージを利用して、新しいビュー合成で Zero123 をトレーニングすることにより、強力なゼロショット汎化能力が達成されることを示します。私たちは、Objaverse-XL のリリースにより、3D ビジョンの分野で大規模なさらなる革新が可能になることを期待しています。
Natural language processing and 2D vision models have attained remarkable proficiency on many tasks primarily by escalating the scale of training data. However, 3D vision tasks have not seen the same progress, in part due to the challenges of acquiring high-quality 3D data. In this work, we present Objaverse-XL, a dataset of over 10 million 3D objects. Our dataset comprises deduplicated 3D objects from a diverse set of sources, including manually designed objects, photogrammetry scans of landmarks and everyday items, and professional scans of historic and antique artifacts. Representing the largest scale and diversity in the realm of 3D datasets, Objaverse-XL enables significant new possibilities for 3D vision. Our experiments demonstrate the improvements enabled with the scale provided by Objaverse-XL. We show that by training Zero123 on novel view synthesis, utilizing over 100 million multi-view rendered images, we achieve strong zero-shot generalization abilities. We hope that releasing Objaverse-XL will enable further innovations in the field of 3D vision at scale.
updated: Tue Jul 11 2023 17:57:40 GMT+0000 (UTC)
published: Tue Jul 11 2023 17:57:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト