3D対応の画像生成モデリングは、明示的に制御可能なカメラポーズで3D整合性のある画像を生成することを目的としています。最近の研究では、構造化されていない2D画像でニューラルラディアンスフィールド(NeRF)ジェネレーターをトレーニングすることで有望な結果が示されていますが、それでも詳細な高リアルな画像を生成することはできません。重要な理由は、体積表現学習の高いメモリと計算コストが、トレーニング中の放射輝度統合のためのポイントサンプルの数を大幅に制限することです。不十分なサンプリングは、ジェネレータの表現力を制限して細部を処理するだけでなく、不安定なモンテカルロサンプリングによって引き起こされるノイズのために効果的なGANトレーニングを妨げます。 3Dボリュームで学習された陰関数曲面のセットとして具体化された2Dマニフォールドでのポイントサンプリングと放射輝度フィールド学習を調整する新しいアプローチを提案します。表示光線ごとに、光線と表面の交差を計算し、ネットワークによって生成された放射輝度を累積します。このようなラディアンスマニホールドをトレーニングおよびレンダリングすることにより、当社のジェネレーターは、リアルな細部と強力な視覚的3D一貫性を備えた高品質の画像を生成できます。
3D-aware image generative modeling aims to generate 3D-consistent images with explicitly controllable camera poses. Recent works have shown promising results by training neural radiance field (NeRF) generators on unstructured 2D images, but still can not generate highly-realistic images with fine details. A critical reason is that the high memory and computation cost of volumetric representation learning greatly restricts the number of point samples for radiance integration during training. Deficient sampling not only limits the expressive power of the generator to handle fine details but also impedes effective GAN training due to the noise caused by unstable Monte Carlo sampling. We propose a novel approach that regulates point sampling and radiance field learning on 2D manifolds, embodied as a set of learned implicit surfaces in the 3D volume. For each viewing ray, we calculate ray-surface intersections and accumulate their radiance generated by the network. By training and rendering such radiance manifolds, our generator can produce high quality images with realistic fine details and strong visual 3D consistency.