arXiv reaDer
イージーからハードまでの学習戦略による動的データフリーの知識の蒸留
Dynamic Data-Free Knowledge Distillation by Easy-to-Hard Learning Strategy
データフリーの知識蒸留 (DFKD) は、トレーニング データが利用できない知識蒸留 (KD) に対して広く使用されている戦略です。トレーニング データにアクセスすることなく、事前トレーニングされた大規模な教師モデルを利用して軽量の学生モデルをトレーニングします。ただし、既存の DFKD 手法は、学習中のスチューデント モデルのステータスに基づいて生成ターゲットを動的に調整しないため、不適切で不安定なトレーニング プロセスに悩まされています。この制限に対処するために、CuDFKD と呼ばれる新しい DFKD 手法を提案します。人間の学習方法を反映し、簡単から難しい擬似サンプルを徐々に生成する動的な戦略によって生徒を指導します。さらに、CuDFKD は学生モデルのステータスに応じて生成ターゲットを動的に適応させます。さらに、メジャー化最小化 (MM) アルゴリズムの理論的分析を提供し、CuDFKD の収束について説明します。 DFKD 法の堅牢性と忠実性を測定するために、さらに 2 つの指標を提案します。実験では、CuDFKD がすべてのデータセットで最先端 (SOTA) DFKD 法と同等のパフォーマンスを示すことが示されました。実験では、私たちの CuDFKD が他の SOTA DFKD メソッドよりも最速の収束と最高の堅牢性を備えていることも示しています。
Data-free knowledge distillation (DFKD) is a widely-used strategy for Knowledge Distillation (KD) whose training data is not available. It trains a lightweight student model with the aid of a large pretrained teacher model without any access to training data. However, existing DFKD methods suffer from inadequate and unstable training process, as they do not adjust the generation target dynamically based on the status of the student model during learning. To address this limitation, we propose a novel DFKD method called CuDFKD. It teaches students by a dynamic strategy that gradually generates easy-to-hard pseudo samples, mirroring how humans learn. Besides, CuDFKD adapts the generation target dynamically according to the status of student model. Moreover, We provide a theoretical analysis of the majorization minimization (MM) algorithm and explain the convergence of CuDFKD. To measure the robustness and fidelity of DFKD methods, we propose two more metrics, and experiments shows CuDFKD has comparable performance to state-of-the-art (SOTA) DFKD methods on all datasets. Experiments also present that our CuDFKD has the fastest convergence and best robustness over other SOTA DFKD methods.
updated: Tue Jul 04 2023 01:57:51 GMT+0000 (UTC)
published: Mon Aug 29 2022 14:51:57 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト