arXiv reaDer
蒸留信号のない小さな自己教師あり対照モデルの有効性について
On the Efficacy of Small Self-Supervised Contrastive Models without Distillation Signals
小さなモデルは、自己教師あり対照学習のパラダイムの下では非常に不十分に機能するというのがコンセンサスです。既存の方法は通常、知識の蒸留を介して知識を小さなモデルに転送するために、大きな既製のモデルを採用しています。それらの有効性にもかかわらず、蒸留ベースの方法は、大規模なモデルを展開するための莫大な計算費用のために、一部のリソースが制限されたシナリオには適さない場合があります。この論文では、蒸留信号のない自己教師あり小型モデルのトレーニングの問題を研究します。最初に、小さなモデルの表現空間を評価し、無視できない2つの観察を行います。(i)小さなモデルは、容量が限られているにもかかわらず、過剰適合することなく口実タスクを完了することができます。 (ii)小さなモデルは、一般的にオーバークラスタリングの問題に悩まされています。次に、オーバークラスタリング現象を軽減すると考えられる複数の仮定を検証します。最後に、検証済みの手法を組み合わせて、かなりのマージンを持って5つの小さなアーキテクチャのベースラインを改善します。これは、蒸留信号がなくても、小さな自己教師あり対照モデルのトレーニングが可能であることを示しています。
It is a consensus that small models perform quite poorly under the paradigm of self-supervised contrastive learning. Existing methods usually adopt a large off-the-shelf model to transfer knowledge to the small one via knowledge distillation. Despite their effectiveness, distillation-based methods may not be suitable for some resource-restricted scenarios due to the huge computational expenses of deploying a large model. In this paper, we study the issue of training self-supervised small models without distillation signals. We first evaluate the representation spaces of the small models and make two non-negligible observations: (i) small models can complete the pretext task without overfitting despite its limited capacity; (ii) small models universally suffer the problem of over-clustering. Then we verify multiple assumptions that are considered to alleviate the over-clustering phenomenon. Finally, we combine the validated techniques and improve the baseline of five small architectures with considerable margins, which indicates that training small self-supervised contrastive models is feasible even without distillation signals.
updated: Fri Jul 30 2021 17:10:05 GMT+0000 (UTC)
published: Fri Jul 30 2021 17:10:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト