arXiv reaDer
改良された AR モデルで多彩な 3D 形状生成を学習
Learning Versatile 3D Shape Generation with Improved AR Models
自己回帰 (AR) モデルは、グリッド空間でジョイント分布をモデル化することにより、2D 画像生成において印象的な結果を達成しました。このアプローチは強力な形状生成のために 3D ドメインに拡張されましたが、まだ 2 つの制限があります。ボリューム グリッドでの高価な計算と、グリッド次元に沿ったあいまいな自己回帰順序です。これらの制限を克服するために、ボリューム グリッドの代わりに潜在ベクトルに基づく離散表現学習を適用する、3D 形状生成用の改善された自己回帰モデル (ImAM) を提案します。私たちのアプローチは、計算コストを削減するだけでなく、より扱いやすい順序で結合分布を学習することにより、重要な幾何学的詳細を保持します。さらに、モデル アーキテクチャのシンプルさのおかげで、点群、カテゴリ、画像、テキストなどのさまざまな条件付け入力を連結することで、無条件生成から条件付き生成に自然に拡張できます。広範な実験により、ImAM が複数のカテゴリの多様で忠実な形状を合成し、最先端のパフォーマンスを達成できることが実証されています。
Auto-Regressive (AR) models have achieved impressive results in 2D image generation by modeling joint distributions in the grid space. While this approach has been extended to the 3D domain for powerful shape generation, it still has two limitations: expensive computations on volumetric grids and ambiguous auto-regressive order along grid dimensions. To overcome these limitations, we propose the Improved Auto-regressive Model (ImAM) for 3D shape generation, which applies discrete representation learning based on a latent vector instead of volumetric grids. Our approach not only reduces computational costs but also preserves essential geometric details by learning the joint distribution in a more tractable order. Moreover, thanks to the simplicity of our model architecture, we can naturally extend it from unconditional to conditional generation by concatenating various conditioning inputs, such as point clouds, categories, images, and texts. Extensive experiments demonstrate that ImAM can synthesize diverse and faithful shapes of multiple categories, achieving state-of-the-art performance.
updated: Sun Mar 26 2023 12:03:18 GMT+0000 (UTC)
published: Sun Mar 26 2023 12:03:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト