arXiv reaDer
すべての量子化のための1つのモデル:ホットスワップビット幅調整をサポートする量子化ネットワーク
One Model for All Quantization: A Quantized Network Supporting Hot-Swap Bit-Width Adjustment
エッジデバイスにディープニューラルネットワークを実装するための効果的な手法として、モデルの量子化は多くの実用的なアプリケーションにうまく適用されています。量子化認識トレーニング(QAT)またはトレーニング後の量子化(PTQ)の方法に関係なく、それらはすべてターゲットのビット幅に依存します。量子化の精度を調整する場合、量子化モデルを微調整するか、量子化ノイズを最小限に抑える必要があり、実際のアプリケーションでは不便です。この作業では、オンライン量子化ビット幅調整を満たすために、さまざまなビット幅(たとえば、8ビットから1ビットの形式)をサポートするすべての量子化のモデルをトレーニングする方法を提案します。マルチスケール量子化を通じてさまざまな候補者に特定の量子化戦略を提供できるのは、ホットスワップ可能です。ウェーブレット分解と再構成を使用して重みの多様性を高め、特に超低ビット幅(3ビット、2ビット、1ビットなど)で各量子化候補のパフォーマンスを大幅に向上させます。 ImageNetとCOCOでの実験結果は、私たちの方法が同じ精度で訓練された専用モデルと同等の精度のパフォーマンスを達成できることを示しています。
As an effective technique to achieve the implementation of deep neural networks in edge devices, model quantization has been successfully applied in many practical applications. No matter the methods of quantization aware training (QAT) or post-training quantization (PTQ), they all depend on the target bit-widths. When the precision of quantization is adjusted, it is necessary to fine-tune the quantized model or minimize the quantization noise, which brings inconvenience in practical applications. In this work, we propose a method to train a model for all quantization that supports diverse bit-widths (e.g., form 8-bit to 1-bit) to satisfy the online quantization bit-width adjustment. It is hot-swappable that can provide specific quantization strategies for different candidates through multiscale quantization. We use wavelet decomposition and reconstruction to increase the diversity of weights, thus significantly improving the performance of each quantization candidate, especially at ultra-low bit-widths (e.g., 3-bit, 2-bit, and 1-bit). Experimental results on ImageNet and COCO show that our method can achieve accuracy comparable performance to dedicated models trained at the same precision.
updated: Tue May 04 2021 08:10:50 GMT+0000 (UTC)
published: Tue May 04 2021 08:10:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト