ハードウェア要件を満たし、長時間の再トレーニングを必要としないディープニューラルネットワーク用のPower-of-Twoトレーニング後量子化(PTQ)メソッドを紹介します。 PTQは、少量のキャリブレーションデータのセットを必要とし、展開が容易ですが、量子化対応トレーニング(QAT)よりも精度が低くなります。 Power-of-Two量子化は、量子化と逆量子化によって導入された乗算を、多くの効率的なアクセラレータで採用されているビットシフトに変換できます。ただし、Power-of-Twoスケールは候補値が少ないため、丸めエラーまたはクリッピングエラーが多くなります。レイヤーごとに静的に決定するのではなく、ネットワーク全体のPower-of-Twoスケールを動的に調整する、新しいPower-of-TwoPTQフレームワークであるRAPQを提案します。理論的には、ネットワーク全体の丸め誤差とクリッピング誤差をトレードオフできます。一方、RAPQの再構成方法は、すべてのユニットのBN情報に基づいています。 ImageNetでの広範な実験は、提案された方法の優れたパフォーマンスを証明しています。ベルとホイッスルがない場合、RAPQはResNet-18とMobileNetV2でそれぞれ65%と48%の精度に達し、重量INT2がINT4でアクティブ化されます。私たちは、より制約がありながらハードウェアに優しいPower-of-Two量子化のためのPTQを最初に提案し、SOTAPTQ法とほぼ同じ精度を達成できることを証明しました。コードがリリースされます。
We introduce a Power-of-Two post-training quantization( PTQ) method for deep neural network that meets hardware requirements and does not call for long-time retraining. PTQ requires a small set of calibration data and is easier for deployment, but results in lower accuracy than Quantization-Aware Training( QAT). Power-of-Two quantization can convert the multiplication introduced by quantization and dequantization to bit-shift that is adopted by many efficient accelerators. However, the Power-of-Two scale has fewer candidate values, which leads to more rounding or clipping errors. We propose a novel Power-of-Two PTQ framework, dubbed RAPQ, which dynamically adjusts the Power-of-Two scales of the whole network instead of statically determining them layer by layer. It can theoretically trade off the rounding error and clipping error of the whole network. Meanwhile, the reconstruction method in RAPQ is based on the BN information of every unit. Extensive experiments on ImageNet prove the excellent performance of our proposed method. Without bells and whistles, RAPQ can reach accuracy of 65% and 48% on ResNet-18 and MobileNetV2 respectively with weight INT2 activation INT4. We are the first to propose PTQ for the more constrained but hardware-friendly Power-of-Two quantization and prove that it can achieve nearly the same accuracy as SOTA PTQ method. The code will be released.