何気なくキャプチャされたニューラル ラディアンス フィールド (NeRF) は、カメラの軌跡の外側でレンダリングされると、フローターや欠陥のあるジオメトリなどのアーティファクトに悩まされます。既存の評価プロトコルは、通常、トレーニング キャプチャの 8 フレームごとに画質を評価するだけであるため、これらの効果をキャプチャしないことがよくあります。新規ビュー合成の進歩を促進するために、新しいデータセットと評価手順を提案します。ここでは、シーンの 2 つのカメラ軌跡が記録されます。1 つはトレーニングに使用され、もう 1 つは評価に使用されます。このより挑戦的な野生の設定では、既存の手作りのレギュラーはフローターを削除したり、シーンのジオメトリを改善したりしないことがわかりました。したがって、ローカル 3D 事前確率と新しい密度ベースのスコア蒸留サンプリング損失を活用して、NeRF 最適化中のアーティファクトを阻止する 3D 拡散ベースの方法を提案します。このデータ駆動型の事前設定により、フローターが削除され、カジュアル キャプチャのシーン ジオメトリが改善されることを示します。
Casually captured Neural Radiance Fields (NeRFs) suffer from artifacts such as floaters or flawed geometry when rendered outside the camera trajectory. Existing evaluation protocols often do not capture these effects, since they usually only assess image quality at every 8th frame of the training capture. To push forward progress in novel-view synthesis, we propose a new dataset and evaluation procedure, where two camera trajectories are recorded of the scene: one used for training, and the other for evaluation. In this more challenging in-the-wild setting, we find that existing hand-crafted regularizers do not remove floaters nor improve scene geometry. Thus, we propose a 3D diffusion-based method that leverages local 3D priors and a novel density-based score distillation sampling loss to discourage artifacts during NeRF optimization. We show that this data-driven prior removes floaters and improves scene geometry for casual captures.