arXiv reaDer
LION: 3D 形状生成のための潜点拡散モデル
LION: Latent Point Diffusion Models for 3D Shape Generation
ノイズ除去拡散モデル (DDM) は、3D 点群合成において有望な結果を示しています。 3D DDM を進化させ、デジタル アーティストに役立つものにするためには、(i) 高い生成品質、(ii) 条件付き合成や形状補間などの操作とアプリケーションの柔軟性、および (iii) 滑らかなサーフェスまたはメッシュを出力する機能が必要です。この目的のために、3D 形状生成のための階層的な潜在点拡散モデル (LION) を導入します。 LION は、グローバル形状潜在表現と点構造化潜在空間を組み合わせた階層的潜在空間を持つ変分オートエンコーダー (VAE) として設定されます。生成のために、これらの潜在空間で 2 つの階層型 DDM をトレーニングします。階層型 VAE アプローチは、点群を直接操作する DDM と比較してパフォーマンスを向上させますが、点構造化された潜在変数は、依然として DDM ベースのモデリングに最適です。実験的に、LION は複数の ShapeNet ベンチマークで最先端の生成パフォーマンスを達成しています。さらに、当社の VAE フレームワークにより、関連するさまざまなタスクに LION を簡単に使用できます。LION は、マルチモーダル形状のノイズ除去とボクセル条件付き合成に優れており、テキスト駆動型および画像駆動型の 3D 生成に適応できます。また、形状の自動エンコードと潜在的な形状の補間を示し、LION を最新の表面再構成技術で強化して、滑らかな 3D メッシュを生成します。 LION は、その高品質な生成、柔軟性、および表面再構成により、3D 形状を扱うアーティストに強力なツールを提供することを願っています。プロジェクト ページとコード: https://nv-tlabs.github.io/LION。
Denoising diffusion models (DDMs) have shown promising results in 3D point cloud synthesis. To advance 3D DDMs and make them useful for digital artists, we require (i) high generation quality, (ii) flexibility for manipulation and applications such as conditional synthesis and shape interpolation, and (iii) the ability to output smooth surfaces or meshes. To this end, we introduce the hierarchical Latent Point Diffusion Model (LION) for 3D shape generation. LION is set up as a variational autoencoder (VAE) with a hierarchical latent space that combines a global shape latent representation with a point-structured latent space. For generation, we train two hierarchical DDMs in these latent spaces. The hierarchical VAE approach boosts performance compared to DDMs that operate on point clouds directly, while the point-structured latents are still ideally suited for DDM-based modeling. Experimentally, LION achieves state-of-the-art generation performance on multiple ShapeNet benchmarks. Furthermore, our VAE framework allows us to easily use LION for different relevant tasks: LION excels at multimodal shape denoising and voxel-conditioned synthesis, and it can be adapted for text- and image-driven 3D generation. We also demonstrate shape autoencoding and latent shape interpolation, and we augment LION with modern surface reconstruction techniques to generate smooth 3D meshes. We hope that LION provides a powerful tool for artists working with 3D shapes due to its high-quality generation, flexibility, and surface reconstruction. Project page and code: https://nv-tlabs.github.io/LION.
updated: Wed Oct 12 2022 08:25:31 GMT+0000 (UTC)
published: Wed Oct 12 2022 08:25:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト