arXiv reaDer
アクショントランスフォーマー:短時間の人間の行動認識のための自己注意モデル
Action Transformer: A Self-Attention Model for Short-Time Human Action Recognition
純粋に注意に基づくディープニューラルネットワークは、設計者からの最小限のアーキテクチャ上の事前情報に依存して、いくつかのドメインにわたって成功しています。ヒューマンアクション認識(HAR)では、注意メカニズムは主に標準の畳み込み層または反復層の上に採用されており、全体的な一般化機能が向上しています。この作業では、アクショントランスフォーマー(AcT)を紹介します。これは、畳み込み層、反復層、および注意力のある層を混合するより精巧なネットワークよりも一貫して優れた、シンプルで完全に自己注意的なアーキテクチャです。以前の人間の行動認識研究に基づいて、計算とエネルギーの要求を制限するために、提案されたアプローチは、小さな時間ウィンドウで2Dポーズ表現を活用し、正確で効果的なリアルタイムパフォーマンスのための低遅延ソリューションを提供します。さらに、リアルタイムの短時間の人間の行動認識のための正式なトレーニングと評価のベンチマークを構築する試みとして、新しい大規模データセットであるMPOSE2021をオープンソース化します。提案された方法論といくつかの以前のアーキテクチャソリューションを使用したMPOSE2021の広範な実験により、AcTモデルの有効性が証明され、HARに関する将来の作業の基盤が提供されます。
Deep neural networks based purely on attention have been successful across several domains, relying on minimal architectural priors from the designer. In Human Action Recognition (HAR), attention mechanisms have been primarily adopted on top of standard convolutional or recurrent layers, improving the overall generalization capability. In this work, we introduce Action Transformer (AcT), a simple, fully self-attentional architecture that consistently outperforms more elaborated networks that mix convolutional, recurrent, and attentive layers. In order to limit computational and energy requests, building on previous human action recognition research, the proposed approach exploits 2D pose representations over small temporal windows, providing a low latency solution for accurate and effective real-time performance. Moreover, we open-source MPOSE2021, a new large-scale dataset, as an attempt to build a formal training and evaluation benchmark for real-time short-time human action recognition. Extensive experimentation on MPOSE2021 with our proposed methodology and several previous architectural solutions proves the effectiveness of the AcT model and poses the base for future work on HAR.
updated: Tue Jul 06 2021 09:11:17 GMT+0000 (UTC)
published: Thu Jul 01 2021 16:53:16 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト