arXiv reaDer
NeuVV:没入型レンダリングと編集を備えたニューラルボリュームビデオ
NeuVV: Neural Volumetric Videos with Immersive Rendering and Editing
メタバースが提供すると約束している最もエキサイティングな体験のいくつか、たとえば、仮想環境での仮想キャラクターとのライブインタラクションには、リアルタイムのフォトリアリスティックレンダリングが必要です。アクティブまたはパッシブのレンダリングへの3D再構築アプローチでは、メッシュまたはポイントクラウドを修正するために大規模なクリーンアップ作業が必要です。この論文では、ニューラルボリュームビデオまたはNeuVVと呼ばれるニューラルボリュームグラフィー技術を紹介し、フォトリアリズムとリアルタイムでボリュームビデオコンテンツの没入型、インタラクティブ、および時空間レンダリングをサポートします。 NeuVVの中核は、動的神経放射輝度フィールド(NeRF)をレンダリング可能で編集可能なプリミティブに効率的にエンコードすることです。 2種類の因数分解スキームを紹介します。空間と時間にわたる滑らかな色の変化をモデル化するための超球面調和関数(HH)分解と、動きによって引き起こされる急激な密度と色の変化をモデル化するための学習可能な基底表現です。 NeuVV因数分解は、PlenOctreeに類似したVideo Octree(VOctree)に統合して、メモリのオーバーヘッドを削減しながらトレーニングを大幅に加速できます。リアルタイムNeuVVレンダリングは、没入型コンテンツ編集ツールのクラスをさらに可能にします。具体的には、NeuVVは各VOctreeをプリミティブとして扱い、ボリュームベースの深度順序付けとアルファブレンディングを実装して、コンテンツの転用のための時空間構成を実現します。たとえば、同じパフォーマンスのさまざまな表現をさまざまなタイミングでさまざまな3D位置に配置したり、パフォーマーの服の色やテクスチャを調整したり、スポットライトの影を落としたり、距離の減衰照明を合成したりするなど、すべてインタラクティブな速度で行います。さらに、消費者レベルのVRヘッドセットをサポートするハイブリッドニューラルラスタライズレンダリングフレームワークを開発し、前述のボリュームビデオの表示と編集を初めて仮想3D空間で没入型に実行できるようにします。
Some of the most exciting experiences that Metaverse promises to offer, for instance, live interactions with virtual characters in virtual environments, require real-time photo-realistic rendering. 3D reconstruction approaches to rendering, active or passive, still require extensive cleanup work to fix the meshes or point clouds. In this paper, we present a neural volumography technique called neural volumetric video or NeuVV to support immersive, interactive, and spatial-temporal rendering of volumetric video contents with photo-realism and in real-time. The core of NeuVV is to efficiently encode a dynamic neural radiance field (NeRF) into renderable and editable primitives. We introduce two types of factorization schemes: a hyper-spherical harmonics (HH) decomposition for modeling smooth color variations over space and time and a learnable basis representation for modeling abrupt density and color changes caused by motion. NeuVV factorization can be integrated into a Video Octree (VOctree) analogous to PlenOctree to significantly accelerate training while reducing memory overhead. Real-time NeuVV rendering further enables a class of immersive content editing tools. Specifically, NeuVV treats each VOctree as a primitive and implements volume-based depth ordering and alpha blending to realize spatial-temporal compositions for content re-purposing. For example, we demonstrate positioning varied manifestations of the same performance at different 3D locations with different timing, adjusting color/texture of the performer's clothing, casting spotlight shadows and synthesizing distance falloff lighting, etc, all at an interactive speed. We further develop a hybrid neural-rasterization rendering framework to support consumer-level VR headsets so that the aforementioned volumetric video viewing and editing, for the first time, can be conducted immersively in virtual 3D space.
updated: Sat Feb 12 2022 15:23:16 GMT+0000 (UTC)
published: Sat Feb 12 2022 15:23:16 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト