量子化は、画像超解像度 (SR) ネットワークの高い計算の複雑さを軽減するための有望なアプローチです。ただし、画像分類などの高レベルのタスクと比較して、低ビット量子化は SR ネットワークでの精度の大幅な低下につながります。これは、SR ネットワークの特徴分布がチャネルごと、または入力画像ごとに大きく異なるため、量子化範囲を決定することが困難であるためです。既存の SR 量子化作業は、テスト中に量子化範囲を変動分布に動的に適応させることで、この分布不一致の問題にアプローチします。ただし、このような動的な適応では追加の計算コストが発生し、量子化の利点が制限されます。代わりに、動的適応を必要とせずに SR ネットワークの分布不一致問題を効果的に克服する、新しい量子化対応トレーニング フレームワークを提案します。直感的には、トレーニング中に特徴の分散を直接正規化することで不一致を減らすことができます。ただし、分散の正則化がトレーニング中に再構築損失と衝突し、SR の精度に悪影響を与える可能性があることが観察されています。したがって、分散の正則化の勾配が再構成の勾配と協調的である場合にのみ分散を正則化することで、2 つの損失間の衝突を回避します。さらに、分布の不一致をさらに減らすために、重大な不一致を持つ層に分布オフセットを導入し、チャネルごとの特徴をスケーリングまたはシフトします。私たちが提案する ODM と呼ばれるアルゴリズムは、最小限の計算オーバーヘッドで分布の不一致を効果的に削減します。実験結果は、ODM が同等またはより少ない計算量で既存の SR 量子化アプローチより効果的に優れていることを示しており、分布の不一致の問題を軽減することの重要性を示しています。私たちのコードは https://github.com/Cheeun/ODM で入手できます。
Quantization is a promising approach to reduce the high computational complexity of image super-resolution (SR) networks. However, compared to high-level tasks like image classification, low-bit quantization leads to severe accuracy loss in SR networks. This is because feature distributions of SR networks are significantly divergent for each channel or input image, and is thus difficult to determine a quantization range. Existing SR quantization works approach this distribution mismatch problem by dynamically adapting quantization ranges to the variant distributions during test time. However, such dynamic adaptation incurs additional computational costs that limit the benefits of quantization. Instead, we propose a new quantization-aware training framework that effectively Overcomes the Distribution Mismatch problem in SR networks without the need for dynamic adaptation. Intuitively, the mismatch can be reduced by directly regularizing the variance in features during training. However, we observe that variance regularization can collide with the reconstruction loss during training and adversely impact SR accuracy. Thus, we avoid the conflict between two losses by regularizing the variance only when the gradients of variance regularization are cooperative with that of reconstruction. Additionally, to further reduce the distribution mismatch, we introduce distribution offsets to layers with a significant mismatch, which either scales or shifts channel-wise features. Our proposed algorithm, called ODM, effectively reduces the mismatch in distributions with minimal computational overhead. Experimental results show that ODM effectively outperforms existing SR quantization approaches with similar or fewer computations, demonstrating the importance of reducing the distribution mismatch problem. Our code is available at https://github.com/Cheeun/ODM.