本論文では、ビデオシーケンスから抽出された身体の骨格を使用して、アクション認識の問題に取り組みます。私たちのアプローチは、固定ランクの正半行列のリーマン多様体上の軌跡を記述するグラミアン行列によってビデオフレームを表す最近の作品の連続性にあります。以前の作品と比較して、固定ランクの正半有限行列の多様体はここで異なるメトリックに恵まれており、カーブフィッティングと時間的アライメントのステップのために異なるアルゴリズムに頼っています。 3つの公開データセット(UTKinect-Action3D、KTH-Action、およびUAV-Gesture)でアプローチを評価しました。提案されたアプローチの結果は、身体の骨格のみが関与する一方で、最先端の方法に関して競争力があります。
In this paper, we tackle the problem of action recognition using body skeletons extracted from video sequences. Our approach lies in the continuity of recent works representing video frames by Gramian matrices that describe a trajectory on the Riemannian manifold of positive-semidefinite matrices of fixed rank. In comparison with previous works, the manifold of fixed-rank positive-semidefinite matrices is here endowed with a different metric, and we resort to different algorithms for the curve fitting and temporal alignment steps. We evaluated our approach on three publicly available datasets (UTKinect-Action3D, KTH-Action and UAV-Gesture). The results of the proposed approach are competitive with respect to state-of-the-art methods, while only involving body skeletons.