arXiv reaDer
ディープニューラルネットワークのシャープネスを意識した量子化
Sharpness-aware Quantization for Deep Neural Networks
ネットワーク量子化は、モデルのサイズと計算コストを削減するための効果的な圧縮方法です。高い圧縮率にもかかわらず、低精度モデルのトレーニングは、量子化の離散的で微分不可能な性質のために困難であり、パフォーマンスが大幅に低下します。最近、Sharpness-Aware Minimization(SAM)が提案され、損失値と損失曲率を同時に最小化することにより、モデルの一般化パフォーマンスを向上させています。この論文では、量子化されたモデルをトレーニングするためのシャープネス認識量子化(SAQ)手法を考案し、一般化のパフォーマンスを向上させます。さらに、各レイヤーはネットワークの損失値と損失シャープネスに異なる影響を与えるため、構成ジェネレーターを学習して各レイヤーのビット幅構成を自動的に決定する効果的な方法をさらに考案し、フラット領域の下位ビットを奨励します。シャープな風景と同時に、最小の平坦性を促進して、より積極的な量子化を可能にします。 CIFAR-100とImageNetでの広範な実験は、提案された方法の優れた性能を示しています。たとえば、55.1xビット演算(BOP)削減を備えた量子化されたResNet-18は、トップ1の精度の点でフル精度のものを0.7%上回っています。コードはhttps://github.com/zhuang-group/SAQで入手できます。
Network quantization is an effective compression method to reduce the model size and computational cost. Despite the high compression ratio, training a low-precision model is difficult due to the discrete and non-differentiable nature of quantization, resulting in considerable performance degradation. Recently, Sharpness-Aware Minimization (SAM) is proposed to improve the generalization performance of the models by simultaneously minimizing the loss value and the loss curvature. In this paper, we devise a Sharpness-Aware Quantization (SAQ) method to train quantized models, leading to better generalization performance. Moreover, since each layer contributes differently to the loss value and the loss sharpness of a network, we further devise an effective method that learns a configuration generator to automatically determine the bitwidth configurations of each layer, encouraging lower bits for flat regions and vice versa for sharp landscapes, while simultaneously promoting the flatness of minima to enable more aggressive quantization. Extensive experiments on CIFAR-100 and ImageNet show the superior performance of the proposed methods. For example, our quantized ResNet-18 with 55.1x Bit-Operation (BOP) reduction even outperforms the full-precision one by 0.7% in terms of the Top-1 accuracy. Code is available at https://github.com/zhuang-group/SAQ.
updated: Wed Nov 24 2021 05:16:41 GMT+0000 (UTC)
published: Wed Nov 24 2021 05:16:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト