arXiv reaDer
3D 人間の姿勢推定のための織り交ぜられたグラフと注意ネットワーク
Interweaved Graph and Attention Network for 3D Human Pose Estimation
単一ビュー画像からの 3D 人間の姿勢推定における大幅な進歩にもかかわらず、以前の研究ではグローバルおよびローカルの相関関係を調査することはめったになく、人間の骨格表現の学習が不十分でした。この問題に対処するために、グラフ畳み込みネットワーク (GCN) と注意の間の双方向通信を可能にする、新しい Interweaved Graph and Attention Network (IGANet) を提案します。具体的には、GCN からのローカル情報がアテンションに提供され、アテンションからのグローバル情報が GCN に注入される IGA モジュールを導入します。さらに、体の関節の多粒度情報を取得できる、シンプルで効果的な U 字型の多層パーセプトロン (uMLP) を設計します。 2 つの一般的なベンチマーク データセット (つまり、Human3.6M と MPI-INF-3DHP) で広範な実験を行い、提案した方法を評価します。結果は、IGANet が両方のデータセットで最先端のパフォーマンスを達成することを示しています。コードは https://github.com/xiu-cs/IGANet で入手できます。
Despite substantial progress in 3D human pose estimation from a single-view image, prior works rarely explore global and local correlations, leading to insufficient learning of human skeleton representations. To address this issue, we propose a novel Interweaved Graph and Attention Network (IGANet) that allows bidirectional communications between graph convolutional networks (GCNs) and attentions. Specifically, we introduce an IGA module, where attentions are provided with local information from GCNs and GCNs are injected with global information from attentions. Additionally, we design a simple yet effective U-shaped multi-layer perceptron (uMLP), which can capture multi-granularity information for body joints. Extensive experiments on two popular benchmark datasets (i.e. Human3.6M and MPI-INF-3DHP) are conducted to evaluate our proposed method.The results show that IGANet achieves state-of-the-art performance on both datasets. Code is available at https://github.com/xiu-cs/IGANet.
updated: Thu Apr 27 2023 09:21:15 GMT+0000 (UTC)
published: Thu Apr 27 2023 09:21:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト