単一の写真から詳細な完全な人体形状を推測するためのシンプルかつ効果的な方法を提示します。このモデルでは、顔、髪、しわなどの衣服を含む全身形状をインタラクティブなフレームレートで推測できます。結果は、入力画像に隠れている部分でも詳細を表示します。私たちの主なアイデアは、形状回帰を調整された画像から画像への変換問題に変えることです。このメソッドへの入力は、既製のメソッドから取得した可視領域の部分的なテクスチャマップです。部分的なテクスチャから、詳細な法線マップとベクトルディスプレイスメントマップを推定します。これは、低解像度のスムーズボディモデルに適用して、ディテールと衣服を追加できます。合成データで純粋に訓練されているにもかかわらず、私たちのモデルは実際の写真によく一般化されています。多数の結果が、この方法の汎用性と堅牢性を示しています。
We present a simple yet effective method to infer detailed full human body shape from only a single photograph. Our model can infer full-body shape including face, hair, and clothing including wrinkles at interactive frame-rates. Results feature details even on parts that are occluded in the input image. Our main idea is to turn shape regression into an aligned image-to-image translation problem. The input to our method is a partial texture map of the visible region obtained from off-the-shelf methods. From a partial texture, we estimate detailed normal and vector displacement maps, which can be applied to a low-resolution smooth body model to add detail and clothing. Despite being trained purely with synthetic data, our model generalizes well to real-world photographs. Numerous results demonstrate the versatility and robustness of our method.