arXiv reaDer
対照的な自己監視学習における変換の構成について
On Compositions of Transformations in Contrastive Self-Supervised Learning
画像領域では、ノイズ対照学習を介してコンテンツ保存変換に不変性を誘導することにより、優れた表現を学習できます。この論文では、対照学習を、不変性または独自性のいずれかが求められる、より幅広い変換セットとその構成に一般化します。 SimCLRなどの既存のメソッドを拡張してそうする方法がすぐには明らかではないことを示します。代わりに、すべての対照的な定式化が満たさなければならないいくつかの正式な要件を紹介し、これらの要件を満たす実用的な構造を提案します。この分析の範囲を最大化するために、データサンプリングを含む、データの特定の一般化された変換(GDT)の選択として、ノイズ対照定式化のすべてのコンポーネントを表現します。次に、ビデオを、さまざまな変換が適用可能なデータの例と見なし、オーディオとテキストを分析するための追加のモダリティと時間の次元を考慮します。特定の変換に対して不変であり、他の変換に対して独特であることは、効果的なビデオ表現を学習し、複数のベンチマークの最先端を大幅に改善し、教師あり事前トレーニングを超えるために重要であることがわかります。
In the image domain, excellent representations can be learned by inducing invariance to content-preserving transformations via noise contrastive learning. In this paper, we generalize contrastive learning to a wider set of transformations, and their compositions, for which either invariance or distinctiveness is sought. We show that it is not immediately obvious how existing methods such as SimCLR can be extended to do so. Instead, we introduce a number of formal requirements that all contrastive formulations must satisfy, and propose a practical construction which satisfies these requirements. In order to maximise the reach of this analysis, we express all components of noise contrastive formulations as the choice of certain generalized transformations of the data (GDTs), including data sampling. We then consider videos as an example of data in which a large variety of transformations are applicable, accounting for the extra modalities -- for which we analyze audio and text -- and the dimension of time. We find that being invariant to certain transformations and distinctive to others is critical to learning effective video representations, improving the state-of-the-art for multiple benchmarks by a large margin, and even surpassing supervised pretraining.
updated: Wed Oct 27 2021 12:00:29 GMT+0000 (UTC)
published: Mon Mar 09 2020 17:56:49 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト