arXiv reaDer
PTQ-SL:サブレイヤーごとのトレーニング後の量子化の調査
PTQ-SL: Exploring the Sub-layerwise Post-training Quantization
ネットワーク量子化は、畳み込みニューラルネットワークを圧縮するための強力な手法です。量子化の粒度は、ネットワーク量子化のパフォーマンスに影響を与える重みでスケーリング係数を共有する方法を決定します。ほとんどの既存のアプローチは、畳み込み層の量子化のために、スケーリング係数を層ごとまたはチャネルごとに共有します。チャネルワイズ量子化とレイヤーワイズ量子化は、さまざまなアプリケーションで広く使用されています。ただし、他の量子化の粒度はめったに調査されません。このホワイトペーパーでは、複数の入力チャネルと出力チャネルでスケーリング係数を共有するサブレイヤーごとの粒度について説明します。サブレイヤーワイズ粒度(PTQ-SL)で効率的なトレーニング後の量子化法を提案します。次に、さまざまな粒度で体系的に実験し、量子化されたニューラルネットワークの予測精度が粒度と強い相関関係があることを確認します。さらに、チャネルの位置を調整すると、サブレイヤーごとの量子化のパフォーマンスが向上することがわかります。したがって、サブレイヤーごとの量子化のためにチャネルを並べ替える方法を提案します。実験は、適切なチャネルの並べ替えを伴うサブレイヤーごとの量子化が、チャネルごとの量子化よりも優れている可能性があることを示しています。
Network quantization is a powerful technique to compress convolutional neural networks. The quantization granularity determines how to share the scaling factors in weights, which affects the performance of network quantization. Most existing approaches share the scaling factors layerwisely or channelwisely for quantization of convolutional layers. Channelwise quantization and layerwise quantization have been widely used in various applications. However, other quantization granularities are rarely explored. In this paper, we will explore the sub-layerwise granularity that shares the scaling factor across multiple input and output channels. We propose an efficient post-training quantization method in sub-layerwise granularity (PTQ-SL). Then we systematically experiment on various granularities and observe that the prediction accuracy of the quantized neural network has a strong correlation with the granularity. Moreover, we find that adjusting the position of the channels can improve the performance of sub-layerwise quantization. Therefore, we propose a method to reorder the channels for sub-layerwise quantization. The experiments demonstrate that the sub-layerwise quantization with appropriate channel reordering can outperform the channelwise quantization.
updated: Fri Oct 15 2021 02:18:54 GMT+0000 (UTC)
published: Fri Oct 15 2021 02:18:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト