arXiv reaDer
知識蒸留のための相互情報量の推定と最大化
Estimating and Maximizing Mutual Information for Knowledge Distillation
この作業では、相互情報量最大化知識蒸留(MIMKD)を提案します。私たちの方法は、対照的な目的を使用して、教師と学生のネットワーク間のローカルおよびグローバルな特徴表現の相互情報量の下限を同時に推定し、最大化します。広範な実験を通じて、これを使用して、よりパフォーマンスが高いが計算コストの高いモデルから知識を転送することにより、低容量モデルのパフォーマンスを向上できることを示します。これを使用して、計算リソースの少ないデバイスで実行できるより優れたモデルを作成できます。私たちの方法は柔軟性があり、任意のネットワークアーキテクチャを持つ教師から任意の学生ネットワークに知識を抽出できます。私たちの経験的結果は、MIMKDが、さまざまな能力、さまざまなアーキテクチャ、および学生ネットワークの能力が非常に低い場合に、さまざまな学生と教師のペアで競合するアプローチよりも優れていることを示しています。 ResNet-50から知識を抽出することにより、69.8%のベースライン精度からShufflenetV2を使用したCIFAR100で74.55%の精度を得ることができます。 Imagenetでは、ResNet-34教師ネットワークを使用して、ResNet-18ネットワークの精度を68.88%から70.32%(1.44%+)に向上させています。
In this work, we propose Mutual Information Maximization Knowledge Distillation (MIMKD). Our method uses a contrastive objective to simultaneously estimate and maximize a lower bound on the mutual information of local and global feature representations between a teacher and a student network. We demonstrate through extensive experiments that this can be used to improve the performance of low capacity models by transferring knowledge from more performant but computationally expensive models. This can be used to produce better models that can be run on devices with low computational resources. Our method is flexible, we can distill knowledge from teachers with arbitrary network architectures to arbitrary student networks. Our empirical results show that MIMKD outperforms competing approaches across a wide range of student-teacher pairs with different capacities, with different architectures, and when student networks are with extremely low capacity. We are able to obtain 74.55% accuracy on CIFAR100 with a ShufflenetV2 from a baseline accuracy of 69.8% by distilling knowledge from ResNet-50. On Imagenet we improve a ResNet-18 network from 68.88% to 70.32% accuracy (1.44%+) using a ResNet-34 teacher network.
updated: Mon Nov 29 2021 18:24:36 GMT+0000 (UTC)
published: Fri Oct 29 2021 17:49:56 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト