arXiv reaDer
EMP-SSL: 1 回のトレーニング エポックでの自己教師あり学習に向けて
EMP-SSL: Towards Self-Supervised Learning in One Training Epoch
最近、自己教師あり学習 (SSL) は、画像表現の学習において大きな成功を収めました。経験的な成功にもかかわらず、ほとんどの自己教師あり学習方法はむしろ「非効率的な」学習者であり、通常、完全に収束するまでに数百回のトレーニング エポックが必要です。この作業では、効率的な自己教師あり学習への鍵は、各画像インスタンスからのトリミング数を増やすことであることを示しています。最先端の SSL メソッドの 1 つを活用して、Extreme-Multi-Patch Self-Supervised-Learning (EMP-SSL) と呼ばれる単純な形の自己教師あり学習方法を紹介します。ブランチ間の重みの共有、機能ごとの正規化、出力の量子化、勾配の停止などの SSL は、トレーニング エポックを 2 桁削減します。提案された方法は、わずか 1 エポックで CIFAR-10 で 85.1%、CIFAR-100 で 58.5%、Tiny ImageNet で 38.1%、ImageNet-100 で 58.5% に収束できることを示します。さらに、提案された方法は、CIFAR-10 で 91.5%、CIFAR-100 で 70.1%、Tiny ImageNet で 51.5%、ImageNet-100 で 78.9% を、10 回未満のトレーニング エポックで線形プロービングで達成します。さらに、EMP-SSL は、ベースラインの SSL メソッドと比較して、ドメイン外のデータセットへの転送性が大幅に優れていることを示しています。 https://github.com/tsb0601/EMP-SSL でコードを公開します。
Recently, self-supervised learning (SSL) has achieved tremendous success in learning image representation. Despite the empirical success, most self-supervised learning methods are rather "inefficient" learners, typically taking hundreds of training epochs to fully converge. In this work, we show that the key towards efficient self-supervised learning is to increase the number of crops from each image instance. Leveraging one of the state-of-the-art SSL method, we introduce a simplistic form of self-supervised learning method called Extreme-Multi-Patch Self-Supervised-Learning (EMP-SSL) that does not rely on many heuristic techniques for SSL such as weight sharing between the branches, feature-wise normalization, output quantization, and stop gradient, etc, and reduces the training epochs by two orders of magnitude. We show that the proposed method is able to converge to 85.1% on CIFAR-10, 58.5% on CIFAR-100, 38.1% on Tiny ImageNet and 58.5% on ImageNet-100 in just one epoch. Furthermore, the proposed method achieves 91.5% on CIFAR-10, 70.1% on CIFAR-100, 51.5% on Tiny ImageNet and 78.9% on ImageNet-100 with linear probing in less than ten training epochs. In addition, we show that EMP-SSL shows significantly better transferability to out-of-domain datasets compared to baseline SSL methods. We will release the code in https://github.com/tsb0601/EMP-SSL.
updated: Sat Apr 08 2023 10:09:30 GMT+0000 (UTC)
published: Sat Apr 08 2023 10:09:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト