arXiv reaDer
NeMI:新しいビュー合成のためのマルチプレーン画像と神経放射輝度フィールドの統合
NeMI: Unifying Neural Radiance Fields with Multiplane Images for Novel View Synthesis
本論文では、単一画像からの高密度3D再構成を介して新しいビュー合成と深度推定を実行するアプローチを提案します。当社のNeMIは、ニューラル放射輝度フィールド(NeRF)をマルチプレーンイメージ(MPI)と統合します。具体的には、NeMIは、NeRFの一般的な2次元および画像条件付き拡張であり、MPIの連続的な深さの一般化です。入力として単一の画像が与えられた場合、私たちの方法は、任意の深度値で4チャンネル画像(RGBおよびボリューム密度)を予測して、カメラの錐台を共同で再構築し、遮蔽されたコンテンツを埋めます。再構築され、修復された錐台は、微分可能なレンダリングを使用して、新しいRGBビューまたは深度ビューに簡単にレンダリングできます。 RealEstate10K、KITTI、Flowers Light Fieldsでの広範な実験は、NeMIが最新のビュー合成を大幅に上回っていることを示しています。また、注釈付きの深度監視なしで、iBims-1およびNYU-v2の深度推定で競争力のある結果を達成します。 https://vincentfung13.github.io/projects/nemi/で利用可能なプロジェクトページ
In this paper, we propose an approach to perform novel view synthesis and depth estimation via dense 3D reconstruction from a single image. Our NeMI unifies Neural radiance fields (NeRF) with Multiplane Images (MPI). Specifically, our NeMI is a general two-dimensional and image-conditioned extension of NeRF, and a continuous depth generalization of MPI. Given a single image as input, our method predicts a 4-channel image (RGB and volume density) at arbitrary depth values to jointly reconstruct the camera frustum and fill in occluded contents. The reconstructed and inpainted frustum can then be easily rendered into novel RGB or depth views using differentiable rendering. Extensive experiments on RealEstate10K, KITTI and Flowers Light Fields show that our NeMI outperforms state-of-the-art by a large margin in novel view synthesis. We also achieve competitive results in depth estimation on iBims-1 and NYU-v2 without annotated depth supervision. Project page available at https://vincentfung13.github.io/projects/nemi/
updated: Thu Apr 08 2021 02:28:33 GMT+0000 (UTC)
published: Sat Mar 27 2021 13:41:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト