スケルトンベースのアクション認識は近年大きな成功を収めていますが、既存のメソッドのほとんどは、モデルサイズが大きく実行速度が遅いという問題を抱えている可能性があります。この問題を軽減するために、スケルトンシーケンスプロパティを分析して、スケルトンベースのアクション認識のためのダブルフィーチャダブルモーションネットワーク(DD-Net)を提案します。軽量のネットワーク構造(つまり、150万個のパラメーター)を使用することで、DD-Netは1つのGPUで3,500 FPS、または1つのCPUで2,000 FPSの超高速に到達できます。堅牢な機能を採用することで、DD-Netは実験データセットであるSHREC(つまり手のアクション)とJHMDB(つまり身体のアクション)で最先端のパフォーマンスを実現しています。私たちのコードは、このペーパーと共に後でリリースされます。
Although skeleton-based action recognition has achieved great success in recent years, most of the existing methods may suffer from a large model size and slow execution speed. To alleviate this issue, we analyze skeleton sequence properties to propose a Double-feature Double-motion Network (DD-Net) for skeleton-based action recognition. By using a lightweight network structure (i.e., 0.15 million parameters), DD-Net can reach a super fast speed, as 3,500 FPS on one GPU, or, 2,000 FPS on one CPU. By employing robust features, DD-Net achieves the state-of-the-art performance on our experimental datasets: SHREC (i.e., hand actions) and JHMDB (i.e., body actions). Our code will be released with this paper later.