arXiv reaDer
適応ビット幅でディープネットワークを量子化するための改善された手法
Improved Techniques for Quantizing Deep Networks with Adaptive Bit-Widths
適応ビット幅を使用してディープネットワークを量子化することは、多くのデバイスとリソースの制約にわたって効率的に推論するための有望な手法です。量子化プロセスを繰り返し、さまざまな制約に対してさまざまなモデルをトレーニングする静的な方法とは対照的に、適応量子化では、推論中に単一のディープネットワークのビット幅を柔軟に調整して、さまざまなシナリオで即座に適応させることができます。既存の研究は、一般的な画像分類ベンチマークで有望な結果を示していますが、このペーパーでは、そのような適応ネットワークをより効果的にトレーニングする方法を調査します。具体的には、重みとアクティベーションの適応ビット幅でディープニューラルネットワークを量子化するための2つの新しい手法を紹介します。まず、すべてのビット幅でモデルを共同で最適化しながら、知識を低精度の学生に伝達するための高精度の教師を選択するための共同戦略を提案します。次に、知識を効果的に伝達するために、精度の低い学生ネットワークのブロックを精度の高い教師ネットワークの対応するブロックにランダムに置き換えることにより、動的なブロックスワッピング方法を開発します。初めてビデオ分類ベンチマークを含む複数の画像分類データセットでの広範な実験は、最先端の方法に対する私たちのアプローチの有効性をよく示しています。
Quantizing deep networks with adaptive bit-widths is a promising technique for efficient inference across many devices and resource constraints. In contrast to static methods that repeat the quantization process and train different models for different constraints, adaptive quantization enables us to flexibly adjust the bit-widths of a single deep network during inference for instant adaptation in different scenarios. While existing research shows encouraging results on common image classification benchmarks, this paper investigates how to train such adaptive networks more effectively. Specifically, we present two novel techniques for quantizing deep neural networks with adaptive bit-widths of weights and activations. First, we propose a collaborative strategy to choose a high-precision teacher for transferring knowledge to the low-precision student while jointly optimizing the model with all bit-widths. Second, to effectively transfer knowledge, we develop a dynamic block swapping method by randomly replacing the blocks in the lower-precision student network with the corresponding blocks in the higher-precision teacher network. Extensive experiments on multiple image classification datasets including video classification benchmarks for the first time, well demonstrate the efficacy of our approach over state-of-the-art methods.
updated: Fri Sep 10 2021 21:18:24 GMT+0000 (UTC)
published: Tue Mar 02 2021 03:09:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト