arXiv reaDer
Q-ViT:VisionTransformerの完全に微分可能な量子化
Q-ViT: Fully Differentiable Quantization for Vision Transformer
本論文では、量子化スケールとビット幅の両方が学習可能なパラメータである、Q-ViTと名付けられたビジョントランス(ViT)のための完全に微分可能な量子化法を提案する。具体的には、ViTのヘッドが異なる量子化ロバスト性を示すという観察に基づいて、パフォーマンスを維持しながら、ヘッドごとのビット幅を活用してQ-ViTのサイズを絞り込みます。さらに、量子化スケールとビット幅の共同トレーニングにおける収束問題を解決するために、切り替え可能スケールと呼ばれる新しい手法を提案します。このようにして、Q-ViTは、パフォーマンスを大幅に低下させることなく、ViT量子化の限界を3ビットに押し上げます。さらに、ViTのすべてのアーキテクチャコンポーネントの量子化の堅牢性を分析し、マルチヘッド自己注意(MSA)とガウス誤差線形単位(GELU)がViT量子化の重要な側面であることを示します。この研究は、ViT量子化に関するさらなる研究のためのいくつかの洞察を提供します。 DeiTやSwinTransformerなどのさまざまなViTモデルでの広範な実験により、量子化手法の有効性が示されています。特に、私たちの方法は、DeiT-Tinyで最先端の均一量子化方法を1.5%上回っています。
In this paper, we propose a fully differentiable quantization method for vision transformer (ViT) named as Q-ViT, in which both of the quantization scales and bit-widths are learnable parameters. Specifically, based on our observation that heads in ViT display different quantization robustness, we leverage head-wise bit-width to squeeze the size of Q-ViT while preserving performance. In addition, we propose a novel technique named switchable scale to resolve the convergence problem in the joint training of quantization scales and bit-widths. In this way, Q-ViT pushes the limits of ViT quantization to 3-bit without heavy performance drop. Moreover, we analyze the quantization robustness of every architecture component of ViT and show that the Multi-head Self-Attention (MSA) and the Gaussian Error Linear Units (GELU) are the key aspects for ViT quantization. This study provides some insights for further research about ViT quantization. Extensive experiments on different ViT models, such as DeiT and Swin Transformer show the effectiveness of our quantization method. In particular, our method outperforms the state-of-the-art uniform quantization method by 1.5% on DeiT-Tiny.
updated: Wed Jan 19 2022 16:43:17 GMT+0000 (UTC)
published: Wed Jan 19 2022 16:43:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト