arXiv reaDer
ビデオはグラフです:ビデオアクション認識のための構造化グラフモジュール
Video Is Graph: Structured Graph Module for Video Action Recognition
アクション認識の分野では、ビデオクリップは常に後続の処理のために順序付けられたフレームとして扱われます。時空間知覚を実現するために、既存のアプローチでは、隣接する時間的相互作用を畳み込み層に埋め込むことを提案しています。したがって、グローバルセマンティック情報は、複数のローカルレイヤーを階層的にスタックすることで取得できます。ただし、このようなグローバルな時間的蓄積は、浅い層での潜在的な低レベルの全体的な手がかりを無視して、深い層での高レベルのセマンティクスのみを反映できます。この論文では、最初にビデオシーケンスをグラフに変換して、時間フレーム間の直接的な長期依存性を取得することを提案します。変換中にシーケンシャル情報を保持するために、構造化グラフモジュール(SGM)を考案し、ネットワーク全体できめ細かい時間的相互作用を実現します。特に、SGMは、各ノードの隣接ノードをいくつかの時間領域に分割して、多様なシーケンシャルフローでグローバルな構造情報を抽出します。広範な実験は、標準のベンチマークデータセット、つまり、Something-Something V1&V2、Diving48、Kinetics-400、UCF101、およびHMDB51で実行されます。報告されたパフォーマンスと分析は、SGMがより少ない計算の複雑さで卓越した精度を達成できることを示しています。
In the field of action recognition, video clips are always treated as ordered frames for subsequent processing. To achieve spatio-temporal perception, existing approaches propose to embed adjacent temporal interaction in the convolutional layer. The global semantic information can therefore be obtained by stacking multiple local layers hierarchically. However, such global temporal accumulation can only reflect the high-level semantics in deep layers, neglecting the potential low-level holistic clues in shallow layers. In this paper, we first propose to transform a video sequence into a graph to obtain direct long-term dependencies among temporal frames. To preserve sequential information during transformation, we devise a structured graph module (SGM), achieving fine-grained temporal interactions throughout the entire network. In particular, SGM divides the neighbors of each node into several temporal regions so as to extract global structural information with diverse sequential flows. Extensive experiments are performed on standard benchmark datasets, i.e., Something-Something V1 & V2, Diving48, Kinetics-400, UCF101, and HMDB51. The reported performance and analysis demonstrate that SGM can achieve outstanding precision with less computational complexity.
updated: Sun Jan 23 2022 12:38:07 GMT+0000 (UTC)
published: Tue Oct 12 2021 11:27:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト