arXiv reaDer
H-NeRF:動いている人間のレンダリングと時間的再構成のための神経放射輝度フィールド
H-NeRF: Neural Radiance Fields for Rendering and Temporal Reconstruction of Humans in Motion
動きのある人間のレンダリングと時間的(4D)再構成(H-NeRF)のための神経放射輝度フィールドを、まばらなカメラのセットによって、または単眼ビデオからさえもキャプチャして提示します。私たちのアプローチは、新しい損失関数を使用して結合された、ニューラルシーン表現、新しいビューの合成、および暗黙の統計的幾何学的人間表現からのアイデアを組み合わせたものです。事前に均一な占有率で放射輝度フィールドを学習する代わりに、符号付き距離関数を使用して表される構造化された暗黙の人体モデルによってそれを制約します。これにより、まばらなビューからの情報を確実に融合し、トレーニングで観察されたポーズやビューをはるかに超えて一般化することができます。さらに、幾何学的制約を適用して、観察対象の構造(身体と衣服の両方を含む)を共同学習し、放射輝度フィールドを幾何学的にもっともらしい解に正規化します。複数のデータセットでの広範な実験は、私たちのアプローチの堅牢性と正確性、ポーズとビューの小さなトレーニングセットの大幅に外側の一般化機能、および観察された形状を超えた統計的外挿を示しています。
We present neural radiance fields for rendering and temporal (4D) reconstruction of humans in motion (H-NeRF), as captured by a sparse set of cameras or even from a monocular video. Our approach combines ideas from neural scene representation, novel-view synthesis, and implicit statistical geometric human representations, coupled using novel loss functions. Instead of learning a radiance field with a uniform occupancy prior, we constrain it by a structured implicit human body model, represented using signed distance functions. This allows us to robustly fuse information from sparse views and generalize well beyond the poses or views observed in training. Moreover, we apply geometric constraints to co-learn the structure of the observed subject -- including both body and clothing -- and to regularize the radiance field to geometrically plausible solutions. Extensive experiments on multiple datasets demonstrate the robustness and the accuracy of our approach, its generalization capabilities significantly outside a small training set of poses and views, and statistical extrapolation beyond the observed shape.
updated: Tue Nov 02 2021 15:42:09 GMT+0000 (UTC)
published: Tue Oct 26 2021 14:51:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト