arXiv reaDer
Semantic Graph Convolutional Networks for 3D Human Pose Regression
 この論文では、回帰のためにグラフ畳み込みネットワーク(GCN)を学習する問題を研究します。 GCNの現在のアーキテクチャは、各ノードの畳み込みフィルターと共有変換マトリックスの小さな受容フィールドに制限されています。これらの制限に対処するために、セマンティックグラフ畳み込みネットワーク(SemGCN)を提案します。これは、グラフ構造データを使用した回帰タスクで動作する新しいニューラルネットワークアーキテクチャです。 SemGCNは、ローカルノードやグローバルノードの関係などのセマンティック情報をキャプチャすることを学習しますが、これはグラフでは明示的に表されません。これらのセマンティック関係は、追加の監督や手作りのルールなしで、グラウンドトゥルースからエンドツーエンドのトレーニングを通じて学習できます。 SemGCNを3D人間姿勢回帰に適用することをさらに調査します。私たちの定式化は直感的で十分です。2Dと3Dの両方の人間のポーズは、人体の骨格の関節間の関係をエンコードする構造化されたグラフとして表現できるからです。方法を検証するために包括的な研究を実施しています。結果は、SemGCNが最新技術よりも優れている一方で、使用するパラメーターが90%少ないことを証明しています。
In this paper, we study the problem of learning Graph Convolutional Networks (GCNs) for regression. Current architectures of GCNs are limited to the small receptive field of convolution filters and shared transformation matrix for each node. To address these limitations, we propose Semantic Graph Convolutional Networks (SemGCN), a novel neural network architecture that operates on regression tasks with graph-structured data. SemGCN learns to capture semantic information such as local and global node relationships, which is not explicitly represented in the graph. These semantic relationships can be learned through end-to-end training from the ground truth without additional supervision or hand-crafted rules. We further investigate applying SemGCN to 3D human pose regression. Our formulation is intuitive and sufficient since both 2D and 3D human poses can be represented as a structured graph encoding the relationships between joints in the skeleton of a human body. We carry out comprehensive studies to validate our method. The results prove that SemGCN outperforms state of the art while using 90% fewer parameters.
updated: Sun Mar 08 2020 21:56:21 GMT+0000 (UTC)
published: Sat Apr 06 2019 02:52:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト