arXiv reaDer
複数のポイントによるトレーニング後の量子化:混合精度なしの混合精度
Post-training Quantization with Multiple Points: Mixed Precision without Mixed Precision
 モデルを再トレーニングすることなく、事前トレーニング済みのディープニューラルネットワークの重みを離散化する、トレーニング後の量子化問題を検討します。低ビット数の複数のベクトルの線形結合を使用して、完全精度の重みベクトルを近似する量子化方法であるマルチポイント量子化を提案します。これは、単一の低精度数を使用して各重みを近似する一般的な量子化方法とは対照的です。計算上、効率的な貪欲な選択手順を使用してマルチポイント量子化を構築し、出力の誤差に基づいて各量子化重みベクトルの低精度ポイントの数を適応的に決定します。これにより、出力に大きく影響する重要な重みに対してより高い精度レベルを達成でき、「混合精度の効果」が得られますが、物理的な混合精度の実装は必要ありません(特殊なハードウェアアクセラレータが必要です)。経験的に、私たちの方法は共通のオペランドで実装でき、メモリと計算のオーバーヘッドはほとんどありません。この方法は、ImageNet分類に関する一連の最先端の方法よりも優れており、PASCAL VOCオブジェクト検出などのより困難なタスクに一般化できることを示しています。
We consider the post-training quantization problem, which discretizes the weights of pre-trained deep neural networks without re-training the model. We propose multipoint quantization, a quantization method that approximates a full-precision weight vector using a linear combination of multiple vectors of low-bit numbers; this is in contrast to typical quantization methods that approximate each weight using a single low precision number. Computationally, we construct the multipoint quantization with an efficient greedy selection procedure, and adaptively decides the number of low precision points on each quantized weight vector based on the error of its output. This allows us to achieve higher precision levels for important weights that greatly influence the outputs, yielding an 'effect of mixed precision' but without physical mixed precision implementations (which requires specialized hardware accelerators). Empirically, our method can be implemented by common operands, bringing almost no memory and computation overhead. We show that our method outperforms a range of state-of-the-art methods on ImageNet classification and it can be generalized to more challenging tasks like PASCAL VOC object detection.
updated: Thu Jan 14 2021 15:25:38 GMT+0000 (UTC)
published: Thu Feb 20 2020 22:37:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト