スケルトンベースの歩行認識モデルは、ランク1の精度が通常の歩行の場合の90%からコートを使用した場合の歩行の70%まで変化するため、通常、堅牢性の問題に悩まされます。この作業では、空間トランスフレームワークと時間畳み込みネットワークの組み合わせに基づくGait-TRと呼ばれる最先端の堅牢なスケルトンベースの歩行認識モデルを提案します。 Gait-TRは、他のスケルトンベースの歩行モデルに比べて大幅な改善を実現し、よく知られている歩行データセットCASIA-Bでより高い精度と堅牢性を実現します。特にコートを着た歩行の場合、Gait-TRはランク1の歩行認識精度が90%になります。これは、通常、シルエットベースの歩行認識モデルよりも精度が高いシルエットベースのモデルの最良の結果よりも高くなります。さらに、CASIA-Bでの実験では、空間トランスフォーマーが、広く使用されているグラフ畳み込みネットワークよりも、人間の骨格から歩行の特徴を抽出できることが示されています。
Skeleton-based gait recognition models usually suffer from the robustness problem, as the Rank-1 accuracy varies from 90% in normal walking cases to 70% in walking with coats cases. In this work, we propose a state-of-the-art robust skeleton-based gait recognition model called Gait-TR, which is based on the combination of spatial transformer frameworks and temporal convolutional networks. Gait-TR achieves substantial improvements over other skeleton-based gait models with higher accuracy and better robustness on the well-known gait dataset CASIA-B. Particularly in walking with coats cases, Gait-TR get a 90% Rank-1 gait recognition accuracy rate, which is higher than the best result of silhouette-based models, which usually have higher accuracy than the silhouette-based gait recognition models. Moreover, our experiment on CASIA-B shows that the spatial transformer can extract gait features from the human skeleton better than the widely used graph convolutional network.