arXiv reaDer
ラベルなしデータを使用した教師からの学習
Learning from a Teacher using Unlabeled Data
 知識の蒸留は、モデルの圧縮に広く使用されている手法です。蒸留セットアップで使用される教師モデルは、クラス間の関係をキャプチャし、元のデータセットを超えて拡張すると仮定します。経験的に、教師モデルはこのデータを非配布データセット上でも学生モデルに転送できることを示しています。このアプローチを使用して、MNIST、CIFAR-10、およびCaltech-256データセットに関する有望な結果を、さまざまなソースからのラベルなしの画像データを使用して示します。私たちの結果は励みになり、知識の蒸留を理解し、ラベルのないデータを利用してモデルの品質を改善するという観点から、さらに光を当てるのに役立ちます。
Knowledge distillation is a widely used technique for model compression. We posit that the teacher model used in a distillation setup, captures relationships between classes, that extend beyond the original dataset. We empirically show that a teacher model can transfer this knowledge to a student model even on an out-of-distribution dataset. Using this approach, we show promising results on MNIST, CIFAR-10, and Caltech-256 datasets using unlabeled image data from different sources. Our results are encouraging and help shed further light from the perspective of understanding knowledge distillation and utilizing unlabeled data to improve model quality.
updated: Wed Nov 13 2019 03:43:29 GMT+0000 (UTC)
published: Wed Nov 13 2019 03:43:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト