スパースポイントクラウド上に存在するライトフィールドで暗黙的にシーンを表すニューラルポイントライトフィールドを紹介します。微分可能なボリュームレンダリングと学習した暗黙の密度表現を組み合わせることで、小さなシーンの斬新なビューのために写実的な画像を合成することが可能になりました。ニューラルボリュームレンダリング方法では、基礎となる機能シーン表現の高密度サンプリングが必要なため、ボリュームを通過する光線に沿った数百のサンプルでは、基本的に、同じオブジェクトが数百のトレーニングビューに投影される小さなシーンに制限されます。スパースポイントクラウドをニューラル暗黙ライトフィールドに昇格させると、レイごとに1回の暗黙サンプリング操作だけで大きなシーンを効果的に表現できます。これらのポイントライトフィールドは、光線の方向とローカルポイントフィーチャの近傍の関数として機能するため、高密度のオブジェクトカバレッジや視差なしにライトフィールドで調整されたトレーニング画像を補間できます。我々は、既存の暗黙のアプローチでは表現できない現実的な目に見えないビューを合成する、大規模な運転シナリオでの新しいビュー合成のために提案された方法を評価します。 Neural Point Light Fieldsにより、以前はシーンを明示的にモデル化することによってのみ生成可能であった、見えない軌道に沿ったビデオを予測できることを検証します。
We introduce Neural Point Light Fields that represent scenes implicitly with a light field living on a sparse point cloud. Combining differentiable volume rendering with learned implicit density representations has made it possible to synthesize photo-realistic images for novel views of small scenes. As neural volumetric rendering methods require dense sampling of the underlying functional scene representation, at hundreds of samples along a ray cast through the volume, they are fundamentally limited to small scenes with the same objects projected to hundreds of training views. Promoting sparse point clouds to neural implicit light fields allows us to represent large scenes effectively with only a single implicit sampling operation per ray. These point light fields are as a function of the ray direction, and local point feature neighborhood, allowing us to interpolate the light field conditioned training images without dense object coverage and parallax. We assess the proposed method for novel view synthesis on large driving scenarios, where we synthesize realistic unseen views that existing implicit approaches fail to represent. We validate that Neural Point Light Fields make it possible to predict videos along unseen trajectories previously only feasible to generate by explicitly modeling the scene.