arXiv reaDer
正確なアクティベーションクリッピングと適応バッチ正規化によるデータフリー量子化
Data-Free Quantization with Accurate Activation Clipping and Adaptive Batch Normalization
データフリー量子化は、元のトレーニングデータにアクセスせずにニューラルネットワークを低ビット幅に圧縮するタスクです。ほとんどの既存のデータフリー量子化方法は、特に低ビット幅の場合、不正確なアクティベーションクリッピング範囲と量子化誤差のために深刻なパフォーマンスの低下を引き起こします。この論文では、正確なアクティベーションクリッピングと適応バッチ正規化を備えたシンプルで効果的なデータフリー量子化手法を紹介します。正確なアクティベーションクリッピング(AAC)は、完全精度モデルからの正確なアクティベーション情報を活用することにより、モデルの精度を向上させます。適応バッチ正規化は、最初に、バッチ正規化層を適応的に更新することによって、分布の変化からの量子化誤差に対処することを提案します。広範な実験により、提案されたデータフリー量子化手法は驚くほどのパフォーマンスを実現し、ImageNetデータセットでResNet18の64.33%のトップ1精度を達成し、3.7%の絶対的な改善が既存の最先端の手法を上回っていることを示しています。
Data-free quantization is a task that compresses the neural network to low bit-width without access to original training data. Most existing data-free quantization methods cause severe performance degradation due to inaccurate activation clipping range and quantization error, especially for low bit-width. In this paper, we present a simple yet effective data-free quantization method with accurate activation clipping and adaptive batch normalization. Accurate activation clipping (AAC) improves the model accuracy by exploiting accurate activation information from the full-precision model. Adaptive batch normalization firstly proposes to address the quantization error from distribution changes by updating the batch normalization layer adaptively. Extensive experiments demonstrate that the proposed data-free quantization method can yield surprisingly performance, achieving 64.33% top-1 accuracy of ResNet18 on ImageNet dataset, with 3.7% absolute improvement outperforming the existing state-of-the-art methods.
updated: Wed Jun 22 2022 02:54:19 GMT+0000 (UTC)
published: Fri Apr 08 2022 01:56:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト