arXiv reaDer
Learn2Augment: Learning to Composite Videos for Data Augmentation in Action Recognition
ビデオアクション認識のためのデータ拡張の問題に対処します。ビデオの標準的な拡張戦略は手作業で設計されており、どの拡張ポイントが優れているかを知らずにランダムに、またはヒューリスティックを介して、可能な拡張データポイントのスペースをサンプリングします。何が行動認識に適したビデオになるのかを学び、増強のために高品質のサンプルのみを選択することを提案します。特に、データ拡張プロセスとして、フォアグラウンドビデオとバックグラウンドビデオのビデオ合成を選択します。これにより、多様でリアルな新しいサンプルが得られます。実際に合成することなく、どのビデオのペアを拡張するかを学習します。これにより、可能な拡張のスペースが削減されます。これには2つの利点があります。拡張されたペアは平均よりも高品質であるため、計算コストが節約され、最終的なトレーニング済み分類器の精度が向上します。トレーニング設定の全範囲(数ショット、半教師あり、完全教師あり)に関する実験結果を示します。 Kinetics、UCF101、HMDB51の以前の作業とベースラインに比べて、それらすべてで一貫した改善が見られ、限られたデータで新しい最先端の設定を実現しています。半教師あり設定では、最大8.6%の改善が見られます。
We address the problem of data augmentation for video action recognition. Standard augmentation strategies in video are hand-designed and sample the space of possible augmented data points either at random, without knowing which augmented points will be better, or through heuristics. We propose to learn what makes a good video for action recognition and select only high-quality samples for augmentation. In particular, we choose video compositing of a foreground and a background video as the data augmentation process, which results in diverse and realistic new samples. We learn which pairs of videos to augment without having to actually composite them. This reduces the space of possible augmentations, which has two advantages: it saves computational cost and increases the accuracy of the final trained classifier, as the augmented pairs are of higher quality than average. We present experimental results on the entire spectrum of training settings: few-shot, semi-supervised and fully supervised. We observe consistent improvements across all of them over prior work and baselines on Kinetics, UCF101, HMDB51, and achieve a new state-of-the-art on settings with limited data. We see improvements of up to 8.6% in the semi-supervised setting.
updated: Sun Jul 24 2022 01:15:03 GMT+0000 (UTC)
published: Thu Jun 09 2022 23:04:52 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト