最近、生成データフリー量子化は、実際のデータにアクセスせずにニューラルネットワークを低ビット幅に圧縮する実用的なアプローチとして登場しました。完全精度の対応物のバッチ正規化(BN)統計を利用して、ネットワークを量子化するためのデータを生成します。しかし、私たちの研究は、実際には、BN統計によって完全に制約された合成データは、分布およびサンプルレベルで深刻な均質化を被り、量子化されたネットワークの深刻な精度低下を引き起こすことを示しています。このホワイトペーパーでは、有害な均質化を軽減するために、生成データのないトレーニング後の量子化と量子化対応トレーニングのための一般的な多様なサンプル生成(DSG)スキームを紹介します。 DSGでは、最初にBNレイヤーの機能の統計調整を緩めて、分散の制約を緩和します。次に、さまざまなサンプルに対する特定のBN層の損失の影響を強化し、生成プロセスでのサンプル間の相関を抑制して、それぞれ統計的および空間的観点からサンプルを多様化します。広範な実験により、大規模な画像分類タスクの場合、DSGは、特に超低ビット幅(W4A4設定で22%のゲイン)で、さまざまなニューラルアーキテクチャで既存のデータフリー量子化手法を一貫して上回ることができることが示されています。さらに、DSGによって引き起こされるデータの多様化は、さまざまな量子化方法に一般的な利益をもたらします。これは、多様性がデータのない量子化のための高品質の合成データの重要な特性であることを示しています。
Recently, generative data-free quantization emerges as a practical approach that compresses the neural network to low bit-width without access to real data. It generates data to quantize the network by utilizing the batch normalization (BN) statistics of its full-precision counterpart. However, our study shows that in practice, the synthetic data completely constrained by BN statistics suffers severe homogenization at distribution and sample level, which causes serious accuracy degradation of the quantized network. This paper presents a generic Diverse Sample Generation (DSG) scheme for the generative data-free post-training quantization and quantization-aware training, to mitigate the detrimental homogenization. In our DSG, we first slack the statistics alignment for features in the BN layer to relax the distribution constraint. Then we strengthen the loss impact of the specific BN layer for different samples and inhibit the correlation among samples in the generation process, to diversify samples from the statistical and spatial perspective, respectively. Extensive experiments show that for large-scale image classification tasks, our DSG can consistently outperform existing data-free quantization methods on various neural architectures, especially under ultra-low bit-width (e.g., 22% gain under W4A4 setting). Moreover, data diversifying caused by our DSG brings a general gain in various quantization methods, demonstrating diversity is an important property of high-quality synthetic data for data-free quantization.