このペーパーでは、超解像度ネットワークのトレーニング後の量子化手法である Distribution-Flexible Subset Quantization (DFSQ) を紹介します。 DFSQ を開発する動機は、サンプルとチャネル間で大きなばらつきを示す、現在の超解像度モデルの独特の活性化分布に基づいています。この問題に対処するために、DFSQ はアクティベーションのチャネルごとの正規化を実行し、分散に柔軟なサブセット量子化 (SQ) を適用します。この場合、量子化ポイントは、マルチワードの加算対数スケール値で構成されるユニバーサル セットから選択されます。 SQ での量子化点の選択を迅速化するために、K 平均法クラスタリングを使用して重心に最も近い量子化点を選択する高速量子化点選択戦略を提案します。一般的な反復徹底的検索アルゴリズムと比較して、私たちの戦略はユニバーサル セット内のすべての可能な組み合わせの列挙を回避し、時間の複雑さを指数関数から線形に軽減します。その結果、ユニバーサルセットのサイズに対する時間コストの制約が大幅に緩和されます。さまざまな超解像度モデルの広範な評価により、DFSQ は微調整しなくてもパフォーマンスを効果的に維持できることがわかりました。たとえば、Urban ベンチマークで EDSRx2 を量子化する場合、DFSQ は 6 ビットおよび 8 ビット量子化で完全精度の同等のパフォーマンスを達成し、4 ビット量子化で発生する PSNR の低下はわずか 0.1 dB です。コードは https://github.com/zysxmu/DFSQ にあります。
This paper introduces Distribution-Flexible Subset Quantization (DFSQ), a post-training quantization method for super-resolution networks. Our motivation for developing DFSQ is based on the distinctive activation distributions of current super-resolution models, which exhibit significant variance across samples and channels. To address this issue, DFSQ conducts channel-wise normalization of the activations and applies distribution-flexible subset quantization (SQ), wherein the quantization points are selected from a universal set consisting of multi-word additive log-scale values. To expedite the selection of quantization points in SQ, we propose a fast quantization points selection strategy that uses K-means clustering to select the quantization points closest to the centroids. Compared to the common iterative exhaustive search algorithm, our strategy avoids the enumeration of all possible combinations in the universal set, reducing the time complexity from exponential to linear. Consequently, the constraint of time costs on the size of the universal set is greatly relaxed. Extensive evaluations of various super-resolution models show that DFSQ effectively retains performance even without fine-tuning. For example, when quantizing EDSRx2 on the Urban benchmark, DFSQ achieves comparable performance to full-precision counterparts on 6- and 8-bit quantization, and incurs only a 0.1 dB PSNR drop on 4-bit quantization. Code is at https://github.com/zysxmu/DFSQ