モデルの量子化は、モデルのサイズと計算の待ち時間を短縮できます。これは、リソースに制約のあるハードウェア(携帯電話や組み込みデバイスなど)にディープニューラルネットワークを展開するために不可欠な手法になっています。既存の量子化手法は、要素間の関係を無視して、主に重みと活性化値の数値要素を考慮します。表現能力の低下と情報の損失は、通常、パフォーマンスの低下につながります。周波数領域の画像の特性に触発されて、新しいマルチスケールウェーブレット量子化(MWQ)法を提案します。この方法は、ウェーブレット変換によって元のデータをマルチスケール周波数成分に分解し、次に異なるスケールの成分をそれぞれ量子化します。マルチスケール周波数および空間情報を活用して、空間領域での量子化によって引き起こされる情報損失を軽減します。 MWQの柔軟性のため、ImageNetおよびCOCOデータセットで3つのアプリケーション(モデル圧縮、量子化ネットワーク最適化、情報拡張など)を示します。実験結果は、我々の方法がより強い表現能力を持ち、量子化されたニューラルネットワークにおいて効果的な役割を果たすことができることを示しています。
Model quantization can reduce the model size and computational latency, it has become an essential technique for the deployment of deep neural networks on resourceconstrained hardware (e.g., mobile phones and embedded devices). The existing quantization methods mainly consider the numerical elements of the weights and activation values, ignoring the relationship between elements. The decline of representation ability and information loss usually lead to the performance degradation. Inspired by the characteristics of images in the frequency domain, we propose a novel multiscale wavelet quantization (MWQ) method. This method decomposes original data into multiscale frequency components by wavelet transform, and then quantizes the components of different scales, respectively. It exploits the multiscale frequency and spatial information to alleviate the information loss caused by quantization in the spatial domain. Because of the flexibility of MWQ, we demonstrate three applications (e.g., model compression, quantized network optimization, and information enhancement) on the ImageNet and COCO datasets. Experimental results show that our method has stronger representation ability and can play an effective role in quantized neural networks.