arXiv reaDer
2D人間のポーズから人間のメッシュを再構築するための軽量グラフトランスフォーマーネットワーク
A Lightweight Graph Transformer Network for Human Mesh Reconstruction from 2D Human Pose
既存の深層学習ベースのヒューマンメッシュ再構成アプローチは、より高い精度を達成するために、より大きなネットワークを構築する傾向があります。人間のメッシュ再構成モデル(仮想試着システムなど)を実際に使用するための重要な特性であるにもかかわらず、計算の複雑さとモデルサイズはしばしば無視されます。この論文では、2D人間のポーズから人間のメッシュを再構築できる軽量のポーズベースの方法であるGTRSを紹介します。グラフ変換器を使用して構造化および暗黙の関節相関を活用するポーズ分析モジュールと、抽出されたポーズ特徴をメッシュテンプレートと組み合わせて最終的な人間のメッシュを再構築するメッシュ回帰モジュールを提案します。 Human3.6Mおよび3DPWデータセットの広範な評価により、GTRSの効率と一般化を示します。特に、GTRSは、SOTAポーズベースの方法であるPose2Meshよりも高い精度を実現しますが、困難な野生の3DPWデータセットでパラメーター(Params)の10.2%とFLOPの2.5%のみを使用します。コードは公開されます。
Existing deep learning-based human mesh reconstruction approaches have a tendency to build larger networks in order to achieve higher accuracy. Computational complexity and model size are often neglected, despite being key characteristics for practical use of human mesh reconstruction models (e.g. virtual try-on systems). In this paper, we present GTRS, a lightweight pose-based method that can reconstruct human mesh from 2D human pose. We propose a pose analysis module that uses graph transformers to exploit structured and implicit joint correlations, and a mesh regression module that combines the extracted pose feature with the mesh template to reconstruct the final human mesh. We demonstrate the efficiency and generalization of GTRS by extensive evaluations on the Human3.6M and 3DPW datasets. In particular, GTRS achieves better accuracy than the SOTA pose-based method Pose2Mesh while only using 10.2% of the parameters (Params) and 2.5% of the FLOPs on the challenging in-the-wild 3DPW dataset. Code will be publicly available.
updated: Wed Nov 24 2021 18:48:03 GMT+0000 (UTC)
published: Wed Nov 24 2021 18:48:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト