arXiv reaDer
少数のショットの知識蒸留のためのプログレッシブネットワークグラフト
Progressive Network Grafting for Few-Shot Knowledge Distillation
知識の蒸留は、深いモデル圧縮で有望なパフォーマンスを示しています。ただし、ほとんどの既存のアプローチでは、知識の伝達を実現するために大量のラベル付きデータが必要であるため、モデルの圧縮は面倒でコストのかかるプロセスになります。この論文では、実用的な数ショットの知識蒸留シナリオを調査します。ここでは、人間の注釈のない少数のサンプルのみが各カテゴリで利用可能であると想定しています。この目的のために、我々は、数ショットのデータに合わせて調整された原理的な二段蒸留スキームを紹介します。最初のステップでは、生徒のブロックを1つずつ教師に移植し、他の教師のブロックのパラメータと絡み合った移植されたブロックのパラメータを学習します。 2番目のステップでは、トレーニングを受けた生徒のブロックが徐々に接続され、教師のネットワークに一緒に移植されます。これにより、学習した生徒のブロックが互いに適応し、最終的に教師のネットワークに置き換わります。実験は、ラベルのないサンプルがわずかしかない私たちのアプローチが、CIFAR10、CIFAR100、およびILSVRC-2012で満足のいく結果を達成することを示しています。 CIFAR10およびCIFAR100では、完全なデータセットを利用する知識蒸留スキームのパフォーマンスと同等のパフォーマンスが得られます。ソースコードはhttps://github.com/zju-vipa/NetGraftで入手できます。
Knowledge distillation has demonstrated encouraging performances in deep model compression. Most existing approaches, however, require massive labeled data to accomplish the knowledge transfer, making the model compression a cumbersome and costly process. In this paper, we investigate the practical few-shot knowledge distillation scenario, where we assume only a few samples without human annotations are available for each category. To this end, we introduce a principled dual-stage distillation scheme tailored for few-shot data. In the first step, we graft the student blocks one by one onto the teacher, and learn the parameters of the grafted block intertwined with those of the other teacher blocks. In the second step, the trained student blocks are progressively connected and then together grafted onto the teacher network, allowing the learned student blocks to adapt themselves to each other and eventually replace the teacher network. Experiments demonstrate that our approach, with only a few unlabeled samples, achieves gratifying results on CIFAR10, CIFAR100, and ILSVRC-2012. On CIFAR10 and CIFAR100, our performances are even on par with those of knowledge distillation schemes that utilize the full datasets. The source code is available at https://github.com/zju-vipa/NetGraft.
updated: Fri Dec 11 2020 07:38:41 GMT+0000 (UTC)
published: Wed Dec 09 2020 08:34:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト