arXiv reaDer
スケルトンベースのアクション認識のための自己注意ベースのアンカー提案
Self-attention based anchor proposal for skeleton-based action recognition
スケルトンシーケンスは、軽量でコンパクトな特性により、アクション認識タスクに広く使用されています。最近のグラフ畳み込みネットワーク(GCN)アプローチは、非ユークリッドデータの優れたモデリング機能以来、スケルトンベースのアクション認識で大きな成功を収めています。 GCNは、さまざまなアクションを区別するために不可欠な遠方の関節の関係を直接モデル化することなく、短距離の関節の依存関係を利用できます。したがって、多くのGCNアプローチは、階層メカニズムを使用して、より広範囲の近隣情報を集約しようとします。モーション機能学習のために人体の内部関係を包括的にモデル化するために、新しい自己注意ベースのスケルトンアンカー提案(SAP)モジュールを提案します。提案されたSAPモジュールは、既存の階層型GCNアプローチで使用されている固定ペアワイズ骨接続ではなく、高次角度情報のエンコードによるトリプレット表現を使用して、人体の固有の関係を調査することを目的としています。自己注意ベースのアンカー選択方法は、角度情報をエンコードするルートポイントを抽出するために提案されたSAPモジュールで設計されています。提案されたSAPモジュールをMSG3Dなどの一般的な時空間グラフニューラルネットワークと結合することにより、挑戦的なベンチマークデータセットで新しい最先端の精度を実現します。さらなるアブレーション研究により、提案されたSAPモジュールの有効性が示されました。これにより、多くの一般的なスケルトンベースのアクション認識方法のパフォーマンスを明らかに向上させることができます。
Skeleton sequences are widely used for action recognition task due to its lightweight and compact characteristics. Recent graph convolutional network (GCN) approaches have achieved great success for skeleton-based action recognition since its grateful modeling ability of non-Euclidean data. GCN is able to utilize the short-range joint dependencies while lack to directly model the distant joints relations that are vital to distinguishing various actions. Thus, many GCN approaches try to employ hierarchical mechanism to aggregate wider-range neighborhood information. We propose a novel self-attention based skeleton-anchor proposal (SAP) module to comprehensively model the internal relations of a human body for motion feature learning. The proposed SAP module aims to explore inherent relationship within human body using a triplet representation via encoding high order angle information rather than the fixed pair-wise bone connection used in the existing hierarchical GCN approaches. A Self-attention based anchor selection method is designed in the proposed SAP module for extracting the root point of encoding angular information. By coupling proposed SAP module with popular spatial-temporal graph neural networks, e.g. MSG3D, it achieves new state-of-the-art accuracy on challenging benchmark datasets. Further ablation study have shown the effectiveness of our proposed SAP module, which is able to obviously improve the performance of many popular skeleton-based action recognition methods.
updated: Fri Dec 17 2021 10:05:57 GMT+0000 (UTC)
published: Fri Dec 17 2021 10:05:57 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト