静的オブジェクトのモデリングとフリービュー レンダリングのための Neural Radiance Fields (NeRF) の成功は、動的シーンに対する数多くの試みに影響を与えてきました。フリー ビュー ビデオ (FVV) を促進するためにニューラル レンダリングを利用する現在の技術は、オフライン レンダリングに制限されているか、最小限の動きで短いシーケンスのみを処理できます。このホワイトペーパーでは、長時間の動的シーンでリアルタイムの FVV レンダリングを実現するための非常にコンパクトなニューラル表現として、新しい手法である Residual Radiance Field または ReRF を紹介します。 ReRF は、時空間特徴空間内の隣接するタイムスタンプ間の残差情報を明示的にモデル化し、グローバル座標ベースの小さな MLP を特徴デコーダとして使用します。具体的には、ReRF はフレーム間の特徴の類似性を利用するために、コンパクトなモーション グリッドと残差特徴グリッドを採用しています。このような戦略は、品質を犠牲にすることなく大きな動きを処理できることを示しています。さらに、モーション/残差グリッドの滑らかさとスパース性を維持するためのシーケンシャル トレーニング スキームを提示します。 ReRF に基づいて、3 桁の圧縮率を実現する特別な FVV コーデックを設計し、動的シーンの長時間 FVV のオンライン ストリーミングをサポートするコンパニオン ReRF プレーヤーを提供します。広範な実験により、ダイナミックな放射輝度場をコンパクトに表現するための ReRF の有効性が実証され、前例のない自由な視点での視聴体験を速度と品質で実現できます。
The success of the Neural Radiance Fields (NeRFs) for modeling and free-view rendering static objects has inspired numerous attempts on dynamic scenes. Current techniques that utilize neural rendering for facilitating free-view videos (FVVs) are restricted to either offline rendering or are capable of processing only brief sequences with minimal motion. In this paper, we present a novel technique, Residual Radiance Field or ReRF, as a highly compact neural representation to achieve real-time FVV rendering on long-duration dynamic scenes. ReRF explicitly models the residual information between adjacent timestamps in the spatial-temporal feature space, with a global coordinate-based tiny MLP as the feature decoder. Specifically, ReRF employs a compact motion grid along with a residual feature grid to exploit inter-frame feature similarities. We show such a strategy can handle large motions without sacrificing quality. We further present a sequential training scheme to maintain the smoothness and the sparsity of the motion/residual grids. Based on ReRF, we design a special FVV codec that achieves three orders of magnitudes compression rate and provides a companion ReRF player to support online streaming of long-duration FVVs of dynamic scenes. Extensive experiments demonstrate the effectiveness of ReRF for compactly representing dynamic radiance fields, enabling an unprecedented free-viewpoint viewing experience in speed and quality.