arXiv reaDer
EgoRenderer:自己中心的なカメラ画像から人間のアバターをレンダリングする
EgoRenderer: Rendering Human Avatars from Egocentric Camera Images
キャップまたはVRヘッドセットに取り付けられたウェアラブルなエゴセントリック魚眼カメラで撮影された人の全身神経アバターをレンダリングするシステムであるEgoRendererを紹介します。私たちのシステムは、任意の仮想カメラの場所から俳優と彼女の動きの写実的な斬新なビューをレンダリングします。このような自己中心的な画像から全身のアバターをレンダリングするには、トップダウンビューと大きな歪みのために固有の課題が伴います。レンダリングプロセスをテクスチャ合成、ポーズ構築、神経画像変換などのいくつかのステップに分解することで、これらの課題に取り組んでいます。テクスチャ合成のために、入力魚眼画像と基礎となるパラメトリックボディモデルとの間の密な対応を推測し、自己中心的な入力からテクスチャを抽出するニューラルネットワークであるEgo-DPNetを提案します。さらに、動的な外観をエンコードするために、私たちのアプローチは、ポーズや視点全体の詳細な外観の変化をキャプチャする暗黙のテクスチャスタックも学習します。正しいポーズを生成するために、まず、パラメトリックモデルを使用して自己中心的なビューから体のポーズを推定します。次に、パラメトリックモデルをユーザー指定のターゲット視点に投影することにより、外部の自由視点ポーズ画像を合成します。次に、ターゲットポーズ画像とテクスチャを結合された特徴画像に結合します。結合された特徴画像は、ニューラル画像変換ネットワークを使用して出力カラー画像に変換されます。実験的評価は、EgoRendererが自己中心的なカメラを身に着けている人の現実的な自由視点のアバターを生成できることを示しています。いくつかのベースラインとの比較は、私たちのアプローチの利点を示しています。
We present EgoRenderer, a system for rendering full-body neural avatars of a person captured by a wearable, egocentric fisheye camera that is mounted on a cap or a VR headset. Our system renders photorealistic novel views of the actor and her motion from arbitrary virtual camera locations. Rendering full-body avatars from such egocentric images come with unique challenges due to the top-down view and large distortions. We tackle these challenges by decomposing the rendering process into several steps, including texture synthesis, pose construction, and neural image translation. For texture synthesis, we propose Ego-DPNet, a neural network that infers dense correspondences between the input fisheye images and an underlying parametric body model, and to extract textures from egocentric inputs. In addition, to encode dynamic appearances, our approach also learns an implicit texture stack that captures detailed appearance variation across poses and viewpoints. For correct pose generation, we first estimate body pose from the egocentric view using a parametric model. We then synthesize an external free-viewpoint pose image by projecting the parametric model to the user-specified target viewpoint. We next combine the target pose image and the textures into a combined feature image, which is transformed into the output color image using a neural image translation network. Experimental evaluations show that EgoRenderer is capable of generating realistic free-viewpoint avatars of a person wearing an egocentric camera. Comparisons to several baselines demonstrate the advantages of our approach.
updated: Wed Nov 24 2021 18:33:02 GMT+0000 (UTC)
published: Wed Nov 24 2021 18:33:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト