arXiv reaDer
自己教師ありビデオ表現のためのモーションセンシティブコントラスト学習
Motion Sensitive Contrastive Learning for Self-supervised Video Representation
対照的学習は、ビデオ表現学習において大きな可能性を示しています。ただし、既存のアプローチでは、さまざまな下流のビデオ理解タスクに不可欠な短期的なモーション ダイナミクスを十分に活用できません。この論文では、オプティカルフローによってキャプチャされたモーション情報をRGBフレームに注入して特徴学習を強化するモーションセンシティブコントラストラーニング(MSCL)を提案します。これを達成するために、クリップ レベルのグローバルな対照学習に加えて、2 つのモダリティにわたるフレーム レベルの対照目標を持つローカル モーション対照学習 (LMCL) を開発します。さらに、Flow Rotation Augmentation (FRA) を導入して追加のモーション シャッフル ネガティブ サンプルを生成し、Motion Differential Sampling (MDS) を導入してトレーニング サンプルを正確に選別します。標準ベンチマークでの広範な実験により、提案された方法の有効性が検証されます。一般的に使用されている 3D ResNet-18 をバックボーンとして、UCF101 で 91.5%、Something-Something v2 でビデオ分類で 50.3% のトップ 1 精度を達成し、ビデオ検索で UCF101 で 65.6% のトップ 1 リコールを達成しました。 、特に最先端の技術を向上させます。
Contrastive learning has shown great potential in video representation learning. However, existing approaches fail to sufficiently exploit short-term motion dynamics, which are crucial to various down-stream video understanding tasks. In this paper, we propose Motion Sensitive Contrastive Learning (MSCL) that injects the motion information captured by optical flows into RGB frames to strengthen feature learning. To achieve this, in addition to clip-level global contrastive learning, we develop Local Motion Contrastive Learning (LMCL) with frame-level contrastive objectives across the two modalities. Moreover, we introduce Flow Rotation Augmentation (FRA) to generate extra motion-shuffled negative samples and Motion Differential Sampling (MDS) to accurately screen training samples. Extensive experiments on standard benchmarks validate the effectiveness of the proposed method. With the commonly-used 3D ResNet-18 as the backbone, we achieve the top-1 accuracies of 91.5% on UCF101 and 50.3% on Something-Something v2 for video classification, and a 65.6% Top-1 Recall on UCF101 for video retrieval, notably improving the state-of-the-art.
updated: Fri Aug 12 2022 04:06:56 GMT+0000 (UTC)
published: Fri Aug 12 2022 04:06:56 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト