arXiv reaDer
知識の整列と相関によるマルチレベルの知識の蒸留
Multi-level Knowledge Distillation via Knowledge Alignment and Correlation
知識の蒸留 (KD) は、モデルの圧縮と知識の伝達のための重要な手法になっています。この作業では、最初に、さまざまな KD メソッドによって転送された知識の包括的な分析を実行します。ネットワーク間のsoftmax出力のKLダイバージェンスを最小限に抑える従来のKDメソッドは、個々のサンプルのみの知識アライメントに関連していることを示しています。一方、最近の対照的な学習に基づく KD 手法は、主に異なるサンプル間の関係知識、つまり知識相関を伝達します。教師から生徒に完全な知識を伝達することが重要ですが、知識の調整と相関の両方を効果的に考慮して、マルチレベル知識蒸留 (MLKD) を導入します。 MLKD はタスクに依存せず、モデルに依存せず、教師ありまたは自己教師ありの事前訓練を受けた教師から知識を簡単に転送できます。 MLKD が学習した表現の信頼性と伝達性を改善できることを示します。実験は、MLKD がさまざまな (a) 事前トレーニング戦略 (b) ネットワーク アーキテクチャ (c) データセット (d) タスクを含む多数の実験設定で他の最先端の方法よりも優れていることを示しています。
Knowledge distillation (KD) has become an important technique for model compression and knowledge transfer. In this work, we first perform a comprehensive analysis of the knowledge transferred by different KD methods. We demonstrate that traditional KD methods, which minimize the KL divergence of softmax outputs between networks, are related to the knowledge alignment of an individual sample only. Meanwhile, recent contrastive learning-based KD methods mainly transfer relational knowledge between different samples, namely, knowledge correlation. While it is important to transfer the full knowledge from teacher to student, we introduce the Multi-level Knowledge Distillation (MLKD) by effectively considering both knowledge alignment and correlation. MLKD is task-agnostic and model-agnostic, and can easily transfer knowledge from supervised or self-supervised pretrained teachers. We show that MLKD can improve the reliability and transferability of learned representations. Experiments demonstrate that MLKD outperforms other state-of-the-art methods on a large number of experimental settings including different (a) pretraining strategies (b) network architectures (c) datasets (d) tasks.
updated: Fri Jun 04 2021 00:11:35 GMT+0000 (UTC)
published: Tue Dec 01 2020 15:27:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト