arXiv reaDer
敵対的コラボレーションによる知識蒸留の改善
Improved Knowledge Distillation via Adversarial Collaboration
知識の蒸留は、コンパクトでありながら効果的なモデルを得るための重要なアプローチになっています。この目標を達成するために、小規模な学生モデルは、十分に訓練された大規模な教師モデルの知識を活用するように訓練されています。しかし、教師と生徒の間の能力のギャップのために、生徒のパフォーマンスは教師のレベルに到達するのは難しいです。この問題に関して、既存の方法は、代理的な方法を介して教師の知識の難しさを軽減することを提案している。これらのプロキシベースの方法では、教師の知識の喪失が見落とされ、生徒が容量のボトルネックに遭遇する可能性があると主張します。本稿では、知識の喪失を回避することを目的として、容量ギャップの問題を新しい視点から緩和します。教師の知識の一部を犠牲にする代わりに、敵対的な共学習を通じてより強力な生徒を育成することを提案します。この目的のために、我々はさらに、知識蒸留のパフォーマンスを効果的に改善する敵対的協調的知識蒸留(ACKD)法を提案します。具体的には、複数の補助学習者を使用して学生モデルを構築します。一方、学生の能力を高めるために注意メカニズムと敵対的学習を導入する敵対的協調モジュール(ACM)を考案します。 4つの分類タスクに関する広範な実験は、提案されたACKDの優位性を示しています。
Knowledge distillation has become an important approach to obtain a compact yet effective model. To achieve this goal, a small student model is trained to exploit the knowledge of a large well-trained teacher model. However, due to the capacity gap between the teacher and the student, the student's performance is hard to reach the level of the teacher. Regarding this issue, existing methods propose to reduce the difficulty of the teacher's knowledge via a proxy way. We argue that these proxy-based methods overlook the knowledge loss of the teacher, which may cause the student to encounter capacity bottlenecks. In this paper, we alleviate the capacity gap problem from a new perspective with the purpose of averting knowledge loss. Instead of sacrificing part of the teacher's knowledge, we propose to build a more powerful student via adversarial collaborative learning. To this end, we further propose an Adversarial Collaborative Knowledge Distillation (ACKD) method that effectively improves the performance of knowledge distillation. Specifically, we construct the student model with multiple auxiliary learners. Meanwhile, we devise an adversarial collaborative module (ACM) that introduces attention mechanism and adversarial learning to enhance the capacity of the student. Extensive experiments on four classification tasks show the superiority of the proposed ACKD.
updated: Mon Nov 29 2021 07:20:46 GMT+0000 (UTC)
published: Mon Nov 29 2021 07:20:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト