この論文では、低精度ネットワークのトレーニングの課題に取り組みます:微分不可能な量子化関数による低精度ネットワークを介した勾配の伝播の悪名高い難しさ。低精度ネットワークを完全精度の補助モジュールでトレーニングすることにより、ソリューションを提案します。具体的には、トレーニング中に、元の低精度ネットワークに完全精度の補助モジュールを追加することにより、混合精度ネットワークを構築します。次に、拡張された混合精度ネットワークと低精度ネットワークが共同で最適化されます。この戦略は、低精度モデルのパラメーターを更新するために追加の完全精度ルートを作成するため、勾配の逆伝播がより簡単になります。推論時には、低精度ネットワークに計算の複雑さをもたらすことなく、補助モジュールを破棄します。さまざまな量子化アプローチでの画像分類とオブジェクト検出に関する提案方法を評価し、一貫したパフォーマンスの向上を示します。特に、4ビット検出器を使用することにより、完全な精度のモデルに対してほぼ無損失のパフォーマンスを実現します。これは非常に実用的な価値があります。
In this paper, we seek to tackle a challenge in training low-precision networks: the notorious difficulty in propagating gradient through a low-precision network due to the non-differentiable quantization function. We propose a solution by training the low-precision network with a fullprecision auxiliary module. Specifically, during training, we construct a mix-precision network by augmenting the original low-precision network with the full precision auxiliary module. Then the augmented mix-precision network and the low-precision network are jointly optimized. This strategy creates additional full-precision routes to update the parameters of the low-precision model, thus making the gradient back-propagates more easily. At the inference time, we discard the auxiliary module without introducing any computational complexity to the low-precision network. We evaluate the proposed method on image classification and object detection over various quantization approaches and show consistent performance increase. In particular, we achieve near lossless performance to the full-precision model by using a 4-bit detector, which is of great practical value.