arXiv reaDer
階層グラフ-人間の動きの生成モデリングのための畳み込み変分オートエンコーディング
Hierarchical Graph-Convolutional Variational AutoEncoding for Generative Modelling of Human Motion
人間の動きのモデルは、通常、軌道予測またはアクション分類のいずれかに焦点を合わせていますが、両方に焦点を当てることはめったにありません。人間の動きの顕著な不均一性と複雑な構成性により、各タスクは、実際のシナリオに共通するデータの劣化と分布の変化に対して脆弱になります。十分に表現力のある生成的行動モデルは、理論的には、両方のタスクに適用可能な統一されたフレームワーク内でデータ調整と分散レジリエンスを可能にする可能性があります。ここでは、階層型変分オートエンコーダとディープグラフ畳み込みニューラルネットワークに基づく新しいアーキテクチャを提案し、複数のタイムスケールにわたるアクションの全体的なモデルを生成します。この階層グラフ畳み込み変分オートエンコーダー(HG-VAE)が、コヒーレントアクションを生成し、分布外データを検出し、モデルの後方での勾配上昇によって欠落データを代入できることを示します。 H3.6Mとオープンソースの人間の動きデータの最大のコレクションであるAMASSでトレーニングおよび評価された、HG-VAEがベースラインモデルよりも下流の識別学習を促進できることを示します。
Models of human motion commonly focus either on trajectory prediction or action classification but rarely both. The marked heterogeneity and intricate compositionality of human motion render each task vulnerable to the data degradation and distributional shift common to real-world scenarios. A sufficiently expressive generative model of action could in theory enable data conditioning and distributional resilience within a unified framework applicable to both tasks. Here we propose a novel architecture based on hierarchical variational autoencoders and deep graph convolutional neural networks for generating a holistic model of action over multiple time-scales. We show this Hierarchical Graph-convolutional Variational Autoencoder (HG-VAE) to be capable of generating coherent actions, detecting out-of-distribution data, and imputing missing data by gradient ascent on the model's posterior. Trained and evaluated on H3.6M and the largest collection of open source human motion data, AMASS, we show HG-VAE can facilitate downstream discriminative learning better than baseline models.
updated: Mon Nov 29 2021 15:31:26 GMT+0000 (UTC)
published: Wed Nov 24 2021 16:21:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト