arXiv reaDer
より強力な増強を伴う対照学習
Contrastive Learning with Stronger Augmentations
表現学習は、対照的な学習方法の進歩により大幅に開発されました。これらの方法のほとんどは、同じインスタンスから変換された画像を引き続き取得できるように、IDを維持するように注意深く指定されたさまざまなデータ拡張の恩恵を受けています。ただし、これらの注意深く設計された変換では、他の変換によって公開された新しいパターンをさらに調査することが制限されていました。一方、私たちの実験で見つかったように、強い増強は画像の構造を歪め、結果として検索が困難になりました。したがって、現在の対照学習アプローチを補完するために、より強力な拡張を伴う対照学習〜(CLSA)と呼ばれる一般的なフレームワークを提案します。ここでは、インスタンスのプールからの強く増強されたクエリの取得を監視するために、表現バンク全体での弱く増強された画像と強く増強された画像の間の分布の相違が採用されています。 ImageNetデータセットとダウンストリームデータセットでの実験により、強力に拡張された画像からの情報がパフォーマンスを大幅に向上させることができることが示されました。たとえば、CLSAは、教師あり結果の76.5%とほぼ同じレベルである、微調整された単層分類器を備えた標準のResNet-50アーキテクチャを使用してImageNetで76.2%のトップ1精度を達成します。コードと事前トレーニング済みモデルは、https://github.com/maple-research-lab/CLSAで入手できます。
Representation learning has significantly been developed with the advance of contrastive learning methods. Most of those methods have benefited from various data augmentations that are carefully designated to maintain their identities so that the images transformed from the same instance can still be retrieved. However, those carefully designed transformations limited us to further explore the novel patterns exposed by other transformations. Meanwhile, as found in our experiments, the strong augmentations distorted the images' structures, resulting in difficult retrieval. Thus, we propose a general framework called Contrastive Learning with Stronger Augmentations~(CLSA) to complement current contrastive learning approaches. Here, the distribution divergence between the weakly and strongly augmented images over the representation bank is adopted to supervise the retrieval of strongly augmented queries from a pool of instances. Experiments on the ImageNet dataset and downstream datasets showed the information from the strongly augmented images can significantly boost the performance. For example, CLSA achieves top-1 accuracy of 76.2% on ImageNet with a standard ResNet-50 architecture with a single-layer classifier fine-tuned, which is almost the same level as 76.5% of supervised results. The code and pre-trained models are available in https://github.com/maple-research-lab/CLSA.
updated: Thu Apr 15 2021 18:40:04 GMT+0000 (UTC)
published: Thu Apr 15 2021 18:40:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト