Neural Radiance Fields (NeRF) は、その最先端の品質と柔軟性により、新しいビュー合成で大きな成功を収めています。ただし、NeRF では、高密度の入力ビュー (数十から数百) と、1 つのシーンで忠実度の高い画像を生成するための長いトレーニング時間 (数時間から数日) が必要です。ボクセル グリッドを使用して放射輝度フィールドを表すと、最適化プロセスを大幅に加速できますが、まばらな入力の場合、ボクセル グリッドはトレーニング ビューにオーバーフィットしやすく、穴や浮遊物が発生し、アーティファクトにつながることがわかります。この論文では、VGOS を提案します。これは、これらの問題に対処するために、まばらな入力 (3 ~ 10 ビュー) から高速 (3 ~ 5 分) 放射輝度場再構成を行うためのアプローチです。まばらな入力シナリオでボクセルベースの放射輝度フィールドのパフォーマンスを改善するために、2 つの方法を提案します。 (b) ボクセルを平滑化するためにいくつかの正則化手法を使用して、縮退したソリューションを回避します。実験では、VGOS が超高速の収束により、まばらな入力に対して最先端のパフォーマンスを達成することが実証されています。コードは https://github.com/SJoJoK/VGOS で入手できます。
Neural Radiance Fields (NeRF) has shown great success in novel view synthesis due to its state-of-the-art quality and flexibility. However, NeRF requires dense input views (tens to hundreds) and a long training time (hours to days) for a single scene to generate high-fidelity images. Although using the voxel grids to represent the radiance field can significantly accelerate the optimization process, we observe that for sparse inputs, the voxel grids are more prone to overfitting to the training views and will have holes and floaters, which leads to artifacts. In this paper, we propose VGOS, an approach for fast (3-5 minutes) radiance field reconstruction from sparse inputs (3-10 views) to address these issues. To improve the performance of voxel-based radiance field in sparse input scenarios, we propose two methods: (a) We introduce an incremental voxel training strategy, which prevents overfitting by suppressing the optimization of peripheral voxels in the early stage of reconstruction. (b) We use several regularization techniques to smooth the voxels, which avoids degenerate solutions. Experiments demonstrate that VGOS achieves state-of-the-art performance for sparse inputs with super-fast convergence. Code will be available at https://github.com/SJoJoK/VGOS.