さまざまなポーズと重い咬合の下で、単一の単眼RGB画像に基づく3Dハンドモデルの再構築は、長年にわたってコンピュータビジョンの分野で困難な問題でした。この論文では、高品質の3Dハンドモデル再構成のためのSR-Affineアプローチを提案します。まず、MANOの手の再構成のためのエンコーダ-デコーダネットワークアーキテクチャ(AffineNet)を提案します。 MANOの手は詳細ではないため、UVマップ上の画像の超解像によって点群をアップサンプリングするSRNetをさらに提案します。多くの実験は、私たちのアプローチが堅牢であり、FreiHANDおよびHO3Dデータセットを含む標準ベンチマークの最先端の方法よりも優れていることを示しています。
Under various poses and heavy occlusions,3D hand model reconstruction based on a single monocular RGB image has been a challenging problem in computer vision field for many years. In this paper, we propose a SR-Affine approach for high-quality 3D hand model reconstruction. First, we propose an encoder-decoder network architecture (AffineNet) for MANO hand reconstruction. Since MANO hand is not detailed, we further propose SRNet to up-sampling point-clouds by image super-resolution on the UV map. Many experiments demonstrate that our approach is robust and outperforms the state-of-the-art methods on standard benchmarks, including the FreiHAND and HO3D datasets.