arXiv reaDer
HAN:スケルトンベースのジェスチャ認識のための効率的な階層的自己注意ネットワーク
HAN: An Efficient Hierarchical Self-Attention Network for Skeleton-Based Gesture Recognition
スケルトンベースのジェスチャ認識の以前の方法は、ほとんどの場合、スケルトンシーケンスを疑似画像または時空間グラフに配置し、特徴抽出に深い畳み込みニューラルネットワーク(CNN)またはグラフ畳み込みネットワーク(GCN)を適用します。これらの方法は優れた結果を達成しますが、インタラクティブなハンドパーツのローカル機能を動的にキャプチャすることには固有の制限があり、計算効率は依然として深刻な問題です。この作品では、この問題を軽減するために自己注意メカニズムが導入されています。手関節の階層構造を考慮して、CNN、RNN、またはGCN演算子を使用しない純粋な自己注意に基づく、スケルトンベースのジェスチャ認識のための効率的な階層型自己注意ネットワーク(HAN)を提案します。具体的には、関節自己注意モジュールは指の空間的特徴をキャプチャするために使用され、指自己注意モジュールは手全体の特徴を集約するように設計されています。時間的特徴に関しては、時間的自己注意モジュールを利用して、指および手全体の時間的ダイナミクスをキャプチャします。最後に、これらの機能は、ジェスチャ分類のための融合自己注意モジュールによって融合されます。実験は、私たちの方法がはるかに低い計算の複雑さで3つのジェスチャ認識データセットで競争力のある結果を達成することを示しています。
Previous methods for skeleton-based gesture recognition mostly arrange the skeleton sequence into a pseudo picture or spatial-temporal graph and apply deep Convolutional Neural Network (CNN) or Graph Convolutional Network (GCN) for feature extraction. Although achieving superior results, these methods have inherent limitations in dynamically capturing local features of interactive hand parts, and the computing efficiency still remains a serious issue. In this work, the self-attention mechanism is introduced to alleviate this problem. Considering the hierarchical structure of hand joints, we propose an efficient hierarchical self-attention network (HAN) for skeleton-based gesture recognition, which is based on pure self-attention without any CNN, RNN or GCN operators. Specifically, the joint self-attention module is used to capture spatial features of fingers, the finger self-attention module is designed to aggregate features of the whole hand. In terms of temporal features, the temporal self-attention module is utilized to capture the temporal dynamics of the fingers and the entire hand. Finally, these features are fused by the fusion self-attention module for gesture classification. Experiments show that our method achieves competitive results on three gesture recognition datasets with much lower computational complexity.
updated: Fri Jun 25 2021 02:15:53 GMT+0000 (UTC)
published: Fri Jun 25 2021 02:15:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト