arXiv reaDer
HDFormer: 3D 人間の姿勢推定のための高次有向変換器
HDFormer: High-order Directed Transformer for 3D Human Pose Estimation
人間の姿勢推定は、その構造化されたデータ シーケンスの性質により、困難なタスクです。既存の方法は主に体の関節のペアごとの相互作用に焦点を当てていますが、これでは関節が重なり合ったり、ポーズが急速に変化したりするシナリオには不十分です。これらの問題を克服するために、高次の骨と関節の関係を利用して姿勢推定を改善する新しいアプローチである高次有向変換器 (HDFormer) を導入します。具体的には、HDFormer は自己注意と高次注意の両方を組み込んで、多次注意モジュールを定式化します。このモジュールは、1 次の「joint\leftrightarrowjoint」、2 次の「bone\leftrightarrowjoint」、および高次の「hyperbone\leftrightarrowjoint」の相互作用を促進し、複雑でオクルージョンの多い状況における問題に効果的に対処します。さらに、最新の CNN 技術がトランスベースのアーキテクチャに統合されており、パフォーマンスと効率のトレードオフのバランスが保たれています。 HDFormer は、Human3.6M および MPI-INF-3DHP データセットの最先端 (SOTA) モデルを大幅に上回り、必要なパラメーターは 1/10 のみで、計算コストが大幅に低くなります。さらに、HDFormer は現実世界への幅広い適用性を実証し、リアルタイムで正確な 3D 姿勢推定を可能にします。ソースコードはhttps://github.com/hyer/HDFormerにあります。
Human pose estimation is a challenging task due to its structured data sequence nature. Existing methods primarily focus on pair-wise interaction of body joints, which is insufficient for scenarios involving overlapping joints and rapidly changing poses. To overcome these issues, we introduce a novel approach, the High-order Directed Transformer (HDFormer), which leverages high-order bone and joint relationships for improved pose estimation. Specifically, HDFormer incorporates both self-attention and high-order attention to formulate a multi-order attention module. This module facilitates first-order "joint\leftrightarrowjoint", second-order "bone\leftrightarrowjoint", and high-order "hyperbone\leftrightarrowjoint" interactions, effectively addressing issues in complex and occlusion-heavy situations. In addition, modern CNN techniques are integrated into the transformer-based architecture, balancing the trade-off between performance and efficiency. HDFormer significantly outperforms state-of-the-art (SOTA) models on Human3.6M and MPI-INF-3DHP datasets, requiring only 1/10 of the parameters and significantly lower computational costs. Moreover, HDFormer demonstrates broad real-world applicability, enabling real-time, accurate 3D pose estimation. The source code is in https://github.com/hyer/HDFormer
updated: Mon May 22 2023 06:32:17 GMT+0000 (UTC)
published: Fri Feb 03 2023 16:00:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト