arXiv reaDer
CES-KD: ガイド付き知識蒸留のためのカリキュラムベースの専門家選択
CES-KD: Curriculum-based Expert Selection for Guided Knowledge Distillation
知識蒸留 (KD) は、エッジ デバイスの深い分類モデルを圧縮するための効果的なツールです。ただし、KD のパフォーマンスは、教師と生徒のネットワーク間の大きな容量ギャップの影響を受けます。最近の方法では、KD の複数の教師アシスタント (TA) 設定に頼っています。これにより、教師モデルのサイズが順次減少し、これらのモデル間のサイズのギャップが相対的に埋められます。この論文では、キャパシティギャップ問題の下でコンパクトな学生の学習を効率的に強化するために、知識蒸留のためのカリキュラムエキスパート選択(CES-KD)と呼ばれる新しい手法を提案します。この手法は、層化された教育カリキュラムを使用して学生ネットワークを徐々に誘導する必要があるという仮説に基づいて構築されています。これは、能力の低い (高い) 教師ネットワークから簡単な (難しい) データ サンプルをより適切かつ迅速に学習するためです。具体的には、私たちの方法は、画像の分類の難しさによって駆動されるカリキュラムに基づいて、入力画像ごとに 1 人の教師を選択する段階的な TA ベースの KD 手法です。この作業では、仮説を実証的に検証し、CIFAR-10、CIFAR-100、CINIC-10、および ImageNet データセットを使用して厳密に実験し、VGG のようなモデル、ResNets、および WideResNets アーキテクチャで精度の向上を示します。
Knowledge distillation (KD) is an effective tool for compressing deep classification models for edge devices. However, the performance of KD is affected by the large capacity gap between the teacher and student networks. Recent methods have resorted to a multiple teacher assistant (TA) setting for KD, which sequentially decreases the size of the teacher model to relatively bridge the size gap between these models. This paper proposes a new technique called Curriculum Expert Selection for Knowledge Distillation (CES-KD) to efficiently enhance the learning of a compact student under the capacity gap problem. This technique is built upon the hypothesis that a student network should be guided gradually using stratified teaching curriculum as it learns easy (hard) data samples better and faster from a lower (higher) capacity teacher network. Specifically, our method is a gradual TA-based KD technique that selects a single teacher per input image based on a curriculum driven by the difficulty in classifying the image. In this work, we empirically verify our hypothesis and rigorously experiment with CIFAR-10, CIFAR-100, CINIC-10, and ImageNet datasets and show improved accuracy on VGG-like models, ResNets, and WideResNets architectures.
updated: Thu Sep 15 2022 21:02:57 GMT+0000 (UTC)
published: Thu Sep 15 2022 21:02:57 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト