arXiv reaDer
時空間階層型リカレントネットワークによる長期骨格運動の予測
Predicting Long-Term Skeletal Motions by a Spatio-Temporal Hierarchical Recurrent Network
 骨格運動予測の主な目的は、3Dスケルトンのシーケンスを観察することで将来の運動を生成することです。モーション予測の重要な課題は、モーションが複数の異なる方法で実行されることが多く、それぞれがポーズの独自の構成とそれらの時空間依存性で構成され、その結果、予測されたポーズがモーションレスに収束することが多いという事実です長期予測におけるポーズまたは非人間のような動き。これにより、これらのポーズの内部構成と、ローカルおよびグローバルな時空間依存性を明示的に特徴付ける階層型リカレントネットワークモデルを定義することになります。このモデルは、リー代数から潜在ベクトル変数を導入して、空間的および時間的関係を同時に表現します。さらに、構造化スタックLSTMベースのデコーダーは、ポーズ内の各身体部分の量子化された重量を推定するために定義された新しい損失関数で予測されたポーズをデコードするために考案されました。ベンチマークデータセットの経験的評価は、我々のアプローチが短期および長期の両方の動き予測で最先端の方法よりも大幅に優れていることを示唆しています。
The primary goal of skeletal motion prediction is to generate future motion by observing a sequence of 3D skeletons. A key challenge in motion prediction is the fact that a motion can often be performed in several different ways, with each consisting of its own configuration of poses and their spatio-temporal dependencies, and as a result, the predicted poses often converge to the motionless poses or non-human like motions in long-term prediction. This leads us to define a hierarchical recurrent network model that explicitly characterizes these internal configurations of poses and their local and global spatio-temporal dependencies. The model introduces a latent vector variable from the Lie algebra to represent spatial and temporal relations simultaneously. Furthermore, a structured stack LSTM-based decoder is devised to decode the predicted poses with a new loss function defined to estimate the quantized weight of each body part in a pose. Empirical evaluations on benchmark datasets suggest our approach significantly outperforms the state-of-the-art methods on both short-term and long-term motion prediction.
updated: Mon Feb 17 2020 10:44:42 GMT+0000 (UTC)
published: Wed Nov 06 2019 14:07:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト