arXiv reaDer
関係知識の蒸留による対照学習の促進
Boosting Contrastive Learning with Relation Knowledge Distillation
自己監視あり表現学習(SSL)は大規模モデルで効果的であることが証明されていますが、同じソリューションに従う場合、軽量モデルではSSLと監視あり方法の間に大きなギャップがあります。この問題を詳しく調べてみると、インスタンスごとの対比を実行するだけで、軽量モデルがセマンティック空間で崩壊する傾向があることがわかりました。この問題に対処するために、Relation Knowledge Distillation(ReKD)を使用した関係ごとの対照パラダイムを提案します。セマンティック情報を明示的にマイニングし、新しい関係知識を生徒に転送するために、異種の教師を紹介します(軽量モデル)。理論的分析は、インスタンスごとの対比に関する私たちの主な関心事をサポートし、関係ごとの対比学習の有効性を検証します。広範な実験結果はまた、私たちの方法が複数の軽量モデルで大幅な改善を達成することを示しています。特に、AlexNetでの線形評価は、現在の最先端技術を44.7%から50.1%に明らかに改善します。これは、監視対象の50.5%に近づく最初の作業です。コードが利用可能になります。
While self-supervised representation learning (SSL) has proved to be effective in the large model, there is still a huge gap between the SSL and supervised method in the lightweight model when following the same solution. We delve into this problem and find that the lightweight model is prone to collapse in semantic space when simply performing instance-wise contrast. To address this issue, we propose a relation-wise contrastive paradigm with Relation Knowledge Distillation (ReKD). We introduce a heterogeneous teacher to explicitly mine the semantic information and transferring a novel relation knowledge to the student (lightweight model). The theoretical analysis supports our main concern about instance-wise contrast and verify the effectiveness of our relation-wise contrastive learning. Extensive experimental results also demonstrate that our method achieves significant improvements on multiple lightweight models. Particularly, the linear evaluation on AlexNet obviously improves the current state-of-art from 44.7% to 50.1%, which is the first work to get close to the supervised 50.5%. Code will be made available.
updated: Wed Dec 08 2021 08:49:18 GMT+0000 (UTC)
published: Wed Dec 08 2021 08:49:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト