arXiv reaDer
Genie: 量子化のためのデータを見せて
Genie: Show Me the Data for Quantization
ゼロ ショット量子化は、コストやプライバシーに関連する問題など、さまざまな理由でデータにアクセスできない場合に、軽量のディープ ニューラル ネットワークを開発するための有望なアプローチです。 FP32 事前トレーニング済みモデルのバッチ正規化レイヤーの学習パラメーター (μ および σ) を活用することにより、ゼロ ショット量子化スキームは合成データの生成に重点を置きます。その後、事前トレーニング済みのモデル (教師) から量子化されたモデル (生徒) に知識を抽出し、量子化されたモデルを合成データセットで最適化できるようにします。ただし、これまでのところ、ゼロ ショット量子化は主に、再トレーニングと同じくらいタスク固有の損失と長期的な最適化を必要とする量子化を意識したトレーニング方法のコンテキストで説明されてきました。したがって、数時間以内に高品質の量子化ネットワークを生成するゼロショット量子化のトレーニング後の量子化スキームを導入します。さらに、量子化に適したデータを生成する \genie~ というフレームワークを提案します。 Genie によって合成されたデータを使用すると、実際のデータセットを使用せずに堅牢な量子化モデルを生成できます。これは、少数ショットの量子化に匹敵します。また、量子化されたモデルのパフォーマンスを向上させるためのトレーニング後の量子化アルゴリズムも提案します。それらを組み合わせることで、既存のアプローチと比較して量子化パフォーマンスを大幅に改善しながら、ゼロショット量子化と少数ショット量子化の間のギャップを埋めることができます。つまり、独自の最先端のゼロ ショット量子化アプローチを取得できます。
Zero-shot quantization is a promising approach for developing lightweight deep neural networks when data is inaccessible owing to various reasons, including cost and issues related to privacy. By exploiting the learned parameters (μ and σ) of batch normalization layers in an FP32-pre-trained model, zero-shot quantization schemes focus on generating synthetic data. Subsequently, they distill knowledge from the pre-trained model (teacher) to the quantized model (student) such that the quantized model can be optimized with the synthetic dataset. However, thus far, zero-shot quantization has primarily been discussed in the context of quantization-aware training methods, which require task-specific losses and long-term optimization as much as retraining. We thus introduce a post-training quantization scheme for zero-shot quantization that produces high-quality quantized networks within a few hours. Furthermore, we propose a framework called \genie~that generates data suited for quantization. With the data synthesized by Genie, we can produce robust quantized models without real datasets, which is comparable to few-shot quantization. We also propose a post-training quantization algorithm to enhance the performance of quantized models. By combining them, we can bridge the gap between zero-shot and few-shot quantization while significantly improving the quantization performance compared to that of existing approaches. In other words, we can obtain a unique state-of-the-art zero-shot quantization approach.
updated: Mon Apr 03 2023 08:21:02 GMT+0000 (UTC)
published: Fri Dec 09 2022 11:18:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト