arXiv reaDer
Learning Trajectory Dependencies for Human Motion Prediction
人間の動きの予測、つまり観察されたポーズシーケンスが与えられた場合の将来の身体ポーズの予測は、通常、リカレントニューラルネットワーク(RNN)に取り組んできました。ただし、以前の研究で証明されているように、結果のRNNモデルは予測誤差の蓄積に悩まされ、動き予測に望ましくない不連続性をもたらします。この論文では、動き予測のための単純なフィードフォワードディープネットワークを提案します。これは、人体の関節間の時間的滑らかさと空間的依存性の両方を考慮に入れています。このコンテキストでは、次に、従来から使用されているポーズ空間ではなく、軌跡空間で作業することにより、時間情報をエンコードすることを提案します。これにより、時間依存性の範囲(または前の作業で行ったような時間畳み込みフィルターサイズ)を手動で定義する必要がなくなります。さらに、人間の姿勢の空間依存性は、人間の姿勢を、(人間の骨格運動学ツリーではなく)身体の関節のすべてのペア間のリンクによって形成される一般的なグラフとして扱うことによってエンコードされます。事前定義されたグラフ構造を使用する代わりに、新しいグラフ畳み込みネットワークを設計して、グラフの接続性を自動的に学習します。これにより、ネットワークは、人間の運動学的ツリーの依存関係を超えて、長期にわたる依存関係をキャプチャできます。 Human3.6M、CMUモーションキャプチャデータセット、3DPWなど、モーション予測のためのいくつかの標準ベンチマークデータセットでアプローチを評価します。私たちの実験は、提案されたアプローチが最先端のパフォーマンスを実現し、角度ベースと位置ベースの両方のポーズ表現に適用できることを明確に示しています。コードはで入手できます
Human motion prediction, i.e., forecasting future body poses given observed pose sequence, has typically been tackled with recurrent neural networks (RNNs). However, as evidenced by prior work, the resulted RNN models suffer from prediction errors accumulation, leading to undesired discontinuities in motion prediction. In this paper, we propose a simple feed-forward deep network for motion prediction, which takes into account both temporal smoothness and spatial dependencies among human body joints. In this context, we then propose to encode temporal information by working in trajectory space, instead of the traditionally-used pose space. This alleviates us from manually defining the range of temporal dependencies (or temporal convolutional filter size, as done in previous work). Moreover, spatial dependency of human pose is encoded by treating a human pose as a generic graph (rather than a human skeletal kinematic tree) formed by links between every pair of body joints. Instead of using a pre-defined graph structure, we design a new graph convolutional network to learn graph connectivity automatically. This allows the network to capture long range dependencies beyond that of human kinematic tree. We evaluate our approach on several standard benchmark datasets for motion prediction, including Human3.6M, the CMU motion capture dataset and 3DPW. Our experiments clearly demonstrate that the proposed approach achieves state of the art performance, and is applicable to both angle-based and position-based pose representations. The code is available at
updated: Tue Jul 07 2020 02:05:29 GMT+0000 (UTC)
published: Thu Aug 15 2019 06:36:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト