arXiv reaDer
知識蒸留のためのカリキュラム温度
Curriculum Temperature for Knowledge Distillation
ほとんどの既存の蒸留方法は、損失関数における温度の柔軟な役割を無視し、非効率的なグリッド検索によって決定できるハイパーパラメーターとして固定します。一般に、温度は 2 つの分布間の不一致を制御し、蒸留タスクの難易度を忠実に決定できます。体温を一定に保つこと、つまり課題の難易度を一定に保つことは、通常、学習段階が進む成長期の生徒にとって次善の策です。この論文では、動的で学習可能な温度を通じて学生の学習キャリア中のタスクの難易度を制御する、知識蒸留のためのカリキュラム温度 (CTKD) と呼ばれる単純なカリキュラムベースの手法を提案します。具体的には、イージーからハードまでのカリキュラムに従って、温度に応じて蒸留損失を徐々に増加させ、敵対的な方法で蒸留の難易度を高めます。使いやすいプラグイン手法として、CTKD は既存の知識抽出フレームワークにシームレスに統合でき、ごくわずかな追加の計算コストで一般的な改善をもたらします。 CIFAR-100、ImageNet-2012、および MS-COCO での広範な実験により、この方法の有効性が実証されました。コードは https://github.com/zhengli97/CTKD で入手できます。
Most existing distillation methods ignore the flexible role of the temperature in the loss function and fix it as a hyper-parameter that can be decided by an inefficient grid search. In general, the temperature controls the discrepancy between two distributions and can faithfully determine the difficulty level of the distillation task. Keeping a constant temperature, i.e., a fixed level of task difficulty, is usually sub-optimal for a growing student during its progressive learning stages. In this paper, we propose a simple curriculum-based technique, termed Curriculum Temperature for Knowledge Distillation (CTKD), which controls the task difficulty level during the student's learning career through a dynamic and learnable temperature. Specifically, following an easy-to-hard curriculum, we gradually increase the distillation loss w.r.t. the temperature, leading to increased distillation difficulty in an adversarial manner. As an easy-to-use plug-in technique, CTKD can be seamlessly integrated into existing knowledge distillation frameworks and brings general improvements at a negligible additional computation cost. Extensive experiments on CIFAR-100, ImageNet-2012, and MS-COCO demonstrate the effectiveness of our method. Our code is available at https://github.com/zhengli97/CTKD.
updated: Sun Dec 04 2022 09:16:25 GMT+0000 (UTC)
published: Tue Nov 29 2022 14:10:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト