グラフとしての動きの時空間ラプラシアン表現に基づいて、ラプラシアン損失と呼ばれる新しい損失関数を提案します。この損失関数は、ビデオからの 3D 人間の姿勢推定によるモーション再構築用のトレーニング モデルで使用することを目的としています。これは、グラウンド トゥルースのグラフ表現から得られた関節の微分座標を推定の 1 つと比較します。推定の時間的一貫性を向上させるために、モーション再構成用の完全畳み込み時間ネットワークを設計します。この一般的なモデルを使用して、提案された損失関数が Human3.6M によって提供されたベンチマークに与える影響を調べます。また、速度、加速度などのさまざまなモーション記述子を使用して、結果を最先端のソリューションと比較しながら、時間的な一貫性を徹底的に評価します。
We propose a new loss function that we call Laplacian loss, based on spatio-temporal Laplacian representation of the motion as a graph. This loss function is intended to be used in training models for motion reconstruction through 3D human pose estimation from videos. It compares the differential coordinates of the joints obtained from the graph representation of the ground truth against the one of the estimation. We design a fully convolutional temporal network for motion reconstruction to achieve better temporal consistency of estimation. We use this generic model to study the impact of our proposed loss function on the benchmarks provided by Human3.6M. We also make use of various motion descriptors such as velocity, acceleration to make a thorough evaluation of the temporal consistency while comparing the results to some of the state-of-the-art solutions.