arXiv reaDer
モーションエンハンスメントとの注意深いクロスモーダルインタラクションによる圧縮ビデオアクション認識のための表現学習
Representation Learning for Compressed Video Action Recognition via Attentive Cross-modal Interaction with Motion Enhancement
圧縮ビデオアクション認識は、生のビデオをまばらにサンプリングされたRGBフレームと圧縮されたモーションキュー(モーションベクトルや残差など)に置き換えることで、ストレージと計算のコストを大幅に削減するため、最近注目を集めています。ただし、このタスクは、粗くてノイズの多いダイナミクスと、異種RGBとモーションモダリティの不十分な融合に深刻な影響を受けます。上記の2つの問題に対処するために、このペーパーでは、新しいフレームワーク、つまりモーションエンハンスメントを備えた注意深いクロスモーダルインタラクションネットワーク(MEACI-Net)を提案します。これは、2つのストリームアーキテクチャに従います。つまり、1つはRGBモダリティ用で、もう1つはモーションモダリティ用です。特に、モーションストリームは、表現学習を強化するためにノイズ除去モジュールが埋め込まれたマルチスケールブロックを採用しています。次に、Selective Motion Complement(SMC)モジュールとCross-Modality Augment(CMA)モジュールを導入することで、2つのストリーム間の相互作用が強化されます。ここで、SMCはRGBモダリティを時空間的に注意深いローカルモーション機能で補完し、CMAは2つのモダリティをさらに組み合わせます。選択的な機能の拡張。 UCF-101、HMDB-51、およびKinetics-400ベンチマークに関する広範な実験により、MEACI-Netの有効性と効率が実証されています。
Compressed video action recognition has recently drawn growing attention, since it remarkably reduces the storage and computational cost via replacing raw videos by sparsely sampled RGB frames and compressed motion cues (e.g., motion vectors and residuals). However, this task severely suffers from the coarse and noisy dynamics and the insufficient fusion of the heterogeneous RGB and motion modalities. To address the two issues above, this paper proposes a novel framework, namely Attentive Cross-modal Interaction Network with Motion Enhancement (MEACI-Net). It follows the two-stream architecture, i.e. one for the RGB modality and the other for the motion modality. Particularly, the motion stream employs a multi-scale block embedded with a denoising module to enhance representation learning. The interaction between the two streams is then strengthened by introducing the Selective Motion Complement (SMC) and Cross-Modality Augment (CMA) modules, where SMC complements the RGB modality with spatio-temporally attentive local motion features and CMA further combines the two modalities with selective feature augmentation. Extensive experiments on the UCF-101, HMDB-51 and Kinetics-400 benchmarks demonstrate the effectiveness and efficiency of MEACI-Net.
updated: Sat May 07 2022 06:26:49 GMT+0000 (UTC)
published: Sat May 07 2022 06:26:49 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト