arXiv reaDer
蒸留信号のない小さな自己監視対照モデルの有効性について
On the Efficacy of Small Self-Supervised Contrastive Models without Distillation Signals
小さなモデルは、自己監視型の対照学習のパラダイムの下では非常にうまく機能しないというのがコンセンサスです。既存の方法は通常、蒸留を介して知識を小さなモデルに転送するために、大きな既製のモデルを採用しています。それらの有効性にもかかわらず、蒸留ベースの方法は、大規模なモデルを展開するための莫大な計算費用のために、一部のリソースが制限されたシナリオには適さない場合があります。この論文では、蒸留信号なしで自己監視された小さなモデルを訓練する問題を研究します。まず、小さなモデルの表現空間を評価し、無視できない2つの観察を行います。(i)小さなモデルは、容量が限られているにもかかわらず、過剰適合することなく口実タスクを完了できます。(ii)普遍的に、過剰クラスタリングの問題が発生します。次に、オーバークラスタリング現象を軽減すると考えられる複数の仮定を検証します。最後に、検証済みの手法を組み合わせて、5つの小さなアーキテクチャのベースラインパフォーマンスをかなりのマージンで改善します。これは、蒸留信号がなくても、小さな自己監視対照モデルのトレーニングが可能であることを示しています。コードはhttps://github.com/WOWNICE/ssl-smallで入手できます。
It is a consensus that small models perform quite poorly under the paradigm of self-supervised contrastive learning. Existing methods usually adopt a large off-the-shelf model to transfer knowledge to the small one via distillation. Despite their effectiveness, distillation-based methods may not be suitable for some resource-restricted scenarios due to the huge computational expenses of deploying a large model. In this paper, we study the issue of training self-supervised small models without distillation signals. We first evaluate the representation spaces of the small models and make two non-negligible observations: (i) the small models can complete the pretext task without overfitting despite their limited capacity and (ii) they universally suffer the problem of over clustering. Then we verify multiple assumptions that are considered to alleviate the over-clustering phenomenon. Finally, we combine the validated techniques and improve the baseline performances of five small architectures with considerable margins, which indicates that training small self-supervised contrastive models is feasible even without distillation signals. The code is available at https://github.com/WOWNICE/ssl-small.
updated: Mon Dec 13 2021 15:22:08 GMT+0000 (UTC)
published: Fri Jul 30 2021 17:10:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト