arXiv reaDer
TextCraft: テキストから高忠実度で多様な形状をゼロショット生成
TextCraft: Zero-Shot Generation of High-Fidelity and Diverse Shapes from Text
言語は、身の回りの 3D 世界を説明する主要な手段の 1 つです。テキストから 2D 画像への合成では急速な進歩が見られましたが、テキストから 3D 形状への合成における同様の進歩は、ペア (テキスト、形状) データの欠如によって妨げられてきました。さらに、テキストから形状への生成のための既存の方法では、形状の多様性と忠実度が制限されています。 TextCraft を導入します。これは、トレーニング用の (テキスト、形状) ペアを必要とせずに、忠実度の高い多様な 3D 形状を生成することにより、これらの制限に対処する方法です。 TextCraft は、CLIP を使用し、最初に低次元の潜在空間で生成し、次に高解像度にアップスケーリングすることにより、生成された形状の忠実度を向上させるマルチ解像度アプローチを使用してこれを実現します。形状の多様性を改善するために、CLIP によって誘導される交換可能な画像とテキストの埋め込み空間を条件とする双方向トランスフォーマーを使用してモデル化された離散潜在空間を使用します。さらに、精度と多様性のトレードオフをさらに改善する、分類子を使用しないガイダンスの新しいバリアントを提示します。最後に、TextCraft が最先端のベースラインよりも優れていることを示す大規模な実験を行います。
Language is one of the primary means by which we describe the 3D world around us. While rapid progress has been made in text-to-2D-image synthesis, similar progress in text-to-3D-shape synthesis has been hindered by the lack of paired (text, shape) data. Moreover, extant methods for text-to-shape generation have limited shape diversity and fidelity. We introduce TextCraft, a method to address these limitations by producing high-fidelity and diverse 3D shapes without the need for (text, shape) pairs for training. TextCraft achieves this by using CLIP and using a multi-resolution approach by first generating in a low-dimensional latent space and then upscaling to a higher resolution, improving the fidelity of the generated shape. To improve shape diversity, we use a discrete latent space which is modelled using a bidirectional transformer conditioned on the interchangeable image-text embedding space induced by CLIP. Moreover, we present a novel variant of classifier-free guidance, which further improves the accuracy-diversity trade-off. Finally, we perform extensive experiments that demonstrate that TextCraft outperforms state-of-the-art baselines.
updated: Fri Nov 04 2022 17:25:45 GMT+0000 (UTC)
published: Wed Nov 02 2022 18:50:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト