arXiv reaDer
ポーズ予測のための時空間分離可能なグラフ畳み込みネットワーク
Space-Time-Separable Graph Convolutional Network for Pose Forecasting
人間の姿勢予測は複雑な構造化データシーケンスモデリングタスクであり、多くの潜在的なアプリケーションのためにますます注目を集めています。研究は主に、時系列としての時間的次元と、運動学的ツリーまたはグラフによる人体関節の相互作用に取り組んできました。これにより、2つの側面が切り離され、関連分野からの進歩が活用されましたが、人間のポーズの複雑な構造的関節の時空間ダイナミクスの理解も制限されていました。ここでは、ポーズ予測のための新しい時空間分離可能グラフ畳み込みネットワーク(STS-GCN)を提案します。初めて、STS-GCNは、グラフ畳み込みネットワーク(GCN)のみを使用して人間のポーズのダイナミクスをモデル化します。これには、単一グラフフレームワーク内の時間的進化と空間的関節相互作用が含まれます。これにより、モーションと空間相関のクロストークが可能になります。 。同時に、STS-GCNは最初の時空間分離可能なGCNです。時空間グラフの接続性は時空間アフィニティマトリックスに組み込まれ、時空間クロストークをボトルネックにすると同時に、完全なジョイントジョイントと時空間を有効にします。相関関係。両方のアフィニティ行列はエンドツーエンドで学習されるため、接続は標準のキネマティックツリーおよび線形時系列から大幅に逸脱します。 3つの複雑な最近の大規模ベンチマークの実験的評価では、Human3.6M [Ionescu etal。 TPAMI'14]、AMASS [Mahmood etal。 ICCV'19]および3DPW [Von Marcard etal。 ECCV'18]、STS-GCNは最先端技術を上回り、現在の最良の技術を上回っています[Mao etal。 ECCV'20]は、最も困難な長期予測で平均32%以上増加しますが、必要なパラメーターは1.7%のみです。結果を定性的に説明し、因数分解されたジョイントジョイントと時間-時間学習グラフ接続によるグラフの相互作用を示します。ソースコードはhttps://github.com/FraLuca/STSGCNで入手できます。
Human pose forecasting is a complex structured-data sequence-modelling task, which has received increasing attention, also due to numerous potential applications. Research has mainly addressed the temporal dimension as time series and the interaction of human body joints with a kinematic tree or by a graph. This has decoupled the two aspects and leveraged progress from the relevant fields, but it has also limited the understanding of the complex structural joint spatio-temporal dynamics of the human pose. Here we propose a novel Space-Time-Separable Graph Convolutional Network (STS-GCN) for pose forecasting. For the first time, STS-GCN models the human pose dynamics only with a graph convolutional network (GCN), including the temporal evolution and the spatial joint interaction within a single-graph framework, which allows the cross-talk of motion and spatial correlations. Concurrently, STS-GCN is the first space-time-separable GCN: the space-time graph connectivity is factored into space and time affinity matrices, which bottlenecks the space-time cross-talk, while enabling full joint-joint and time-time correlations. Both affinity matrices are learnt end-to-end, which results in connections substantially deviating from the standard kinematic tree and the linear-time time series. In experimental evaluation on three complex, recent and large-scale benchmarks, Human3.6M [Ionescu et al. TPAMI'14], AMASS [Mahmood et al. ICCV'19] and 3DPW [Von Marcard et al. ECCV'18], STS-GCN outperforms the state-of-the-art, surpassing the current best technique [Mao et al. ECCV'20] by over 32% in average at the most difficult long-term predictions, while only requiring 1.7% of its parameters. We explain the results qualitatively and illustrate the graph interactions by the factored joint-joint and time-time learnt graph connections. Our source code is available at: https://github.com/FraLuca/STSGCN
updated: Sat Oct 09 2021 13:59:30 GMT+0000 (UTC)
published: Sat Oct 09 2021 13:59:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト