arXiv reaDer
ビデオアクション認識のための一般化された動きとしての空間と時間の自己相似性の学習
Learning Self-Similarity in Space and Time as Generalized Motion for Video Action Recognition
時空間畳み込みは、ビデオのモーションダイナミクスを学習できないことが多いため、実際のビデオを理解するには、効果的なモーション表現が必要です。本論文では、時空間自己相似性(STSS)に基づく豊かでロバストな運動表現を提案する。フレームのシーケンスが与えられると、STSSは各ローカル領域を空間と時間の隣接領域との類似性として表します。外観の特徴を関係値に変換することにより、学習者は空間と時間の構造パターンをよりよく認識できるようになります。 STSSのボリューム全体を活用し、モデルにSTSSから効果的なモーション表現を抽出する方法を学習させます。提案された神経ブロックはSELFYと呼ばれ、神経アーキテクチャに簡単に挿入でき、追加の監視なしでエンドツーエンドでトレーニングできます。空間と時間に十分な量の近隣があるため、ビデオ内の長期的な相互作用と高速モーションを効果的にキャプチャし、堅牢なアクション認識につながります。私たちの実験的分析は、モーションモデリングの以前の方法に対するその優位性と、直接畳み込みからの時空間的特徴に対するその補完性を示しています。標準のアクション認識ベンチマークであるSomething-Something-V1&V2、Diving-48、およびFineGymでは、提案された方法で最先端の結果が得られます。
Spatio-temporal convolution often fails to learn motion dynamics in videos and thus an effective motion representation is required for video understanding in the wild. In this paper, we propose a rich and robust motion representation based on spatio-temporal self-similarity (STSS). Given a sequence of frames, STSS represents each local region as similarities to its neighbors in space and time. By converting appearance features into relational values, it enables the learner to better recognize structural patterns in space and time. We leverage the whole volume of STSS and let our model learn to extract an effective motion representation from it. The proposed neural block, dubbed SELFY, can be easily inserted into neural architectures and trained end-to-end without additional supervision. With a sufficient volume of the neighborhood in space and time, it effectively captures long-term interaction and fast motion in the video, leading to robust action recognition. Our experimental analysis demonstrates its superiority over previous methods for motion modeling as well as its complementarity to spatio-temporal features from direct convolution. On the standard action recognition benchmarks, Something-Something-V1 & V2, Diving-48, and FineGym, the proposed method achieves the state-of-the-art results.
updated: Tue Nov 02 2021 15:37:46 GMT+0000 (UTC)
published: Sun Feb 14 2021 07:32:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト