arXiv reaDer
知識の蒸留: 優れた教師は忍耐強く、一貫性がある
Knowledge distillation: A good teacher is patient and consistent
最先端の性能を実現する大型モデルと、実用化に向けて手頃な価格のモデルとの間で、コンピューター ビジョンの相違が大きくなっています。このホワイト ペーパーでは、この問題に取り組み、これら 2 種類のモデル間のギャップを大幅に埋めます。私たちの経験的調査を通じて、必ずしも新しい方法を提案することを目指しているわけではありませんが、最先端の大規模モデルを実際に手頃な価格にするための堅牢で効果的なレシピを特定するよう努めています。知識の蒸留が正しく実行された場合、パフォーマンスを犠牲にすることなく大きなモデルのサイズを縮小するための強力なツールになり得ることを示しています。特に、蒸留の有効性に劇的に影響を与える可能性のある特定の暗黙的な設計上の選択があることを明らかにしました。私たちの主な貢献は、これまで文献では明確にされていなかった、これらの設計の選択を明確に特定したことです。包括的な実証研究によって調査結果を裏付け、幅広いビジョン データセットで説得力のある結果を実証し、特に、82.8% のトップ 1 精度を達成する ImageNet 用の最先端の ResNet-50 モデルを取得します。 .
There is a growing discrepancy in computer vision between large-scale models that achieve state-of-the-art performance and models that are affordable in practical applications. In this paper we address this issue and significantly bridge the gap between these two types of models. Throughout our empirical investigation we do not aim to necessarily propose a new method, but strive to identify a robust and effective recipe for making state-of-the-art large scale models affordable in practice. We demonstrate that, when performed correctly, knowledge distillation can be a powerful tool for reducing the size of large models without compromising their performance. In particular, we uncover that there are certain implicit design choices, which may drastically affect the effectiveness of distillation. Our key contribution is the explicit identification of these design choices, which were not previously articulated in the literature. We back up our findings by a comprehensive empirical study, demonstrate compelling results on a wide range of vision datasets and, in particular, obtain a state-of-the-art ResNet-50 model for ImageNet, which achieves 82.8% top-1 accuracy.
updated: Wed Jun 09 2021 17:20:40 GMT+0000 (UTC)
published: Wed Jun 09 2021 17:20:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト