arXiv reaDer
シード:視覚的表現のための自己監視蒸留
SEED: Self-supervised Distillation For Visual Representation
この論文は、小さなモデルの自己教師あり学習に関するものです。この問題は、広く使用されている対照的な自己教師あり学習方法が大規模モデルのトレーニングで大きな進歩を示している一方で、小規模モデルではうまく機能しないという実証研究によって動機付けられています。この問題に対処するために、SElf-SupErvised Distillation(SEED)という名前の新しい学習パラダイムを提案します。このパラダイムでは、より大きなネットワーク(教師として)を活用して、その表現知識をより小さなアーキテクチャ(学生として)に自己監視方式で転送します。 。ラベルのないデータから直接学習する代わりに、一連のインスタンスで教師が推測した類似度スコアの分布を模倣するように学生エンコーダーをトレーニングします。 SEEDがダウンストリームタスクでの小規模ネットワークのパフォーマンスを劇的に向上させることを示します。自己監視ベースラインと比較して、SEEDはTop-1の精度をEfficientNet-B0では42.2%から67.6%に、ImageNet-1kデータセットではMobileNet-v3-Largeでは36.3%から68.2%に向上します。
This paper is concerned with self-supervised learning for small models. The problem is motivated by our empirical studies that while the widely used contrastive self-supervised learning method has shown great progress on large model training, it does not work well for small models. To address this problem, we propose a new learning paradigm, named SElf-SupErvised Distillation (SEED), where we leverage a larger network (as Teacher) to transfer its representational knowledge into a smaller architecture (as Student) in a self-supervised fashion. Instead of directly learning from unlabeled data, we train a student encoder to mimic the similarity score distribution inferred by a teacher over a set of instances. We show that SEED dramatically boosts the performance of small networks on downstream tasks. Compared with self-supervised baselines, SEED improves the top-1 accuracy from 42.2% to 67.6% on EfficientNet-B0 and from 36.3% to 68.2% on MobileNet-v3-Large on the ImageNet-1k dataset.
updated: Thu Apr 15 2021 22:16:01 GMT+0000 (UTC)
published: Tue Jan 12 2021 20:04:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト