arXiv reaDer
時間的情報は対照的な自己教師あり学習に役立ちますか?
Can Temporal Information Help with Contrastive Self-Supervised Learning?
時間的情報の活用は、ビデオ理解モデルの開発に不可欠であると見なされてきました。ただし、時間情報を最近成功したインスタンス識別ベースの対照的な自己教師あり学習(CSL)フレームワークに適切に組み込む方法は不明なままです。直感的な解決策として、一時的な拡張を直接適用しても、一般にビデオCSLが役に立たない、または損なわれることさえあります。この直感に反する観察は、時間的知識のより良い統合のために、既存のビデオCSLフレームワークを再設計する動機を与えます。この目的のために、ビデオCSLを強化するための一般的なパラダイムとして、時間認識の対照的な自己教師あり学習TaCoを紹介します。具体的には、TaCoは、強力なデータ拡張としてだけでなく、ビデオを理解するための追加の自己監視を構成するために、一連の時間変換を選択します。インスタンスを強化された時間変換と共同で対比し、これらの変換を自己監視信号として学習することにより、TaCoは教師なしビデオ表現学習を大幅に強化できます。たとえば、TaCoは、バックボーンとCSLアプローチのリストを超えるダウンストリーム分類タスクの一貫した改善を示しています。私たちの最高のモデルは、85.1%(UCF-101)と51.6%(HMDB-51)のトップ1精度を達成します。これは、以前の最先端技術に比べて3%と2.4%の相対的な改善です。
Leveraging temporal information has been regarded as essential for developing video understanding models. However, how to properly incorporate temporal information into the recent successful instance discrimination based contrastive self-supervised learning (CSL) framework remains unclear. As an intuitive solution, we find that directly applying temporal augmentations does not help, or even impair video CSL in general. This counter-intuitive observation motivates us to re-design existing video CSL frameworks, for better integration of temporal knowledge. To this end, we present Temporal-aware Contrastive self-supervised learningTaCo, as a general paradigm to enhance video CSL. Specifically, TaCo selects a set of temporal transformations not only as strong data augmentation but also to constitute extra self-supervision for video understanding. By jointly contrasting instances with enriched temporal transformations and learning these transformations as self-supervised signals, TaCo can significantly enhance unsupervised video representation learning. For instance, TaCo demonstrates consistent improvement in downstream classification tasks over a list of backbones and CSL approaches. Our best model achieves 85.1% (UCF-101) and 51.6% (HMDB-51) top-1 accuracy, which is a 3% and 2.4% relative improvement over the previous state-of-the-art.
updated: Wed Nov 25 2020 22:14:08 GMT+0000 (UTC)
published: Wed Nov 25 2020 22:14:08 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト