arXiv reaDer
ビジュアルインテリジェンスのための知識の蒸留と生徒と教師の学習:レビューと新しい展望
Knowledge Distillation and Student-Teacher Learning for Visual Intelligence: A Review and New Outlooks
 近年のディープニューラルモデルは、非常に複雑な問題ステートメントを含むほぼすべての分野で成功しています。ただし、これらのモデルはサイズが非常に大きく、数百万(場合によっては数十億)のパラメーターがあるため、より高い計算能力が要求され、エッジデバイスに展開できません。さらに、パフォーマンスの向上は冗長なラベル付きデータに大きく依存します。より速い速度を達成し、データの不足によって引き起こされる問題を処理するために、あるモデルから別のモデルに学習した情報を転送するための知識抽出(KD)が提案されています。 KDは、いわゆる「Student-Teacher」(S-T)学習フレームワークによって特徴付けられることが多く、モデルの圧縮と知識の伝達に広く適用されています。この論文は、近年活発に研究されているKDとS-T学習についてです。まず、KDとは何か、どのように/なぜ機能するのかを説明します。次に、KD手法の最近の進捗状況に関する包括的な調査を、ビジョンタスクに一般的に使用されるS-Tフレームワークとともに提供します。一般に、私たちはこの研究領域を動かしているいくつかの基本的な質問を考慮し、研究の進捗状況と技術的な詳細を徹底的に一般化します。さらに、ビジョンアプリケーションにおけるKDの研究状況を体系的に分析します。最後に、既存の方法の可能性と未解決の課題について説明し、KDおよびS-T学習の将来の方向性を展望します。
Deep neural models in recent years have been successful in almost every field, including extremely complex problem statements. However, these models are huge in size, with millions (and even billions) of parameters, thus demanding more heavy computation power and failing to be deployed on edge devices. Besides, the performance boost is highly dependent on redundant labeled data. To achieve faster speeds and to handle the problems caused by the lack of data, knowledge distillation (KD) has been proposed to transfer information learned from one model to another. KD is often characterized by the so-called `Student-Teacher' (S-T) learning framework and has been broadly applied in model compression and knowledge transfer. This paper is about KD and S-T learning, which are being actively studied in recent years. First, we aim to provide explanations of what KD is and how/why it works. Then, we provide a comprehensive survey on the recent progress of KD methods together with S-T frameworks typically for vision tasks. In general, we consider some fundamental questions that have been driving this research area and thoroughly generalize the research progress and technical details. Additionally, we systematically analyze the research status of KD in vision applications. Finally, we discuss the potentials and open challenges of existing methods and prospect the future directions of KD and S-T learning.
updated: Thu Jun 17 2021 07:17:50 GMT+0000 (UTC)
published: Mon Apr 13 2020 13:45:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト