arXiv reaDer
Fully Quantized Image Super-Resolution Networks
インテリジェントモバイルデバイスの人気が高まるにつれ、正確でリアルタイムでエネルギー効率の高い画像超解像(SR)推論手法を開発することは実用上非常に重要です。推論効率を改善するための一般的な方法は、モデルの量子化です。これにより、高価な浮動小数点演算を効率的な固定小数点演算またはビット演算に置き換えることができます。今日まで、量子化されたSRフレームワークが実現可能な精度と効率のトレードオフを実現することは依然として困難です。ここでは、効率と精度を共同で最適化するために、完全に量子化された画像超解像フレームワーク(FQSR)を提案します。特に、すべてのレイヤーのエンドツーエンドの量子化モデルを取得することを目標としています。これには、特に文献ではめったに取り上げられていないスキップ接続が含まれます。さらに、低ビットSRネットワークが直面するトレーニングの障害を特定し、それに応じて2つの新しい方法を提案します。 2つの困難は、1)活性化と重量分布が異なる層で非常に特徴的であることによって引き起こされます。 2)量子化の不正確な近似。 SRResNet、SRGAN、EDSRなど、複数の主流の超解像アーキテクチャに量子化スキームを適用します。実験結果は、低ビット量子化を使用したFQSRが、5つのベンチマークデータセットのフル精度の対応物と比較して同等のパフォーマンスを達成し、計算コストとメモリ消費を大幅に削減して最先端の量子化SRメソッドを超えることを示しています。
With the rising popularity of intelligent mobile devices, it is of great practical significance to develop accurate, realtime and energy-efficient image Super-Resolution (SR) inference methods. A prevailing method for improving the inference efficiency is model quantization, which allows for replacing the expensive floating-point operations with efficient fixed-point or bitwise arithmetic. To date, it is still challenging for quantized SR frameworks to deliver feasible accuracy-efficiency trade-off. Here, we propose a Fully Quantized image Super-Resolution framework (FQSR) to jointly optimize efficiency and accuracy. In particular, we target on obtaining end-to-end quantized models for all layers, especially including skip connections, which was rarely addressed in the literature. We further identify training obstacles faced by low-bit SR networks and propose two novel methods accordingly. The two difficulites are caused by 1) activation and weight distributions being vastly distinctive in different layers; 2) the inaccurate approximation of the quantization. We apply our quantization scheme on multiple mainstream super-resolution architectures, including SRResNet, SRGAN and EDSR. Experimental results show that our FQSR using low bits quantization can achieve on par performance compared with the full-precision counterparts on five benchmark datasets and surpass state-of-the-art quantized SR methods with significantly reduced computational cost and memory consumption.
updated: Sun Nov 29 2020 03:53:49 GMT+0000 (UTC)
published: Sun Nov 29 2020 03:53:49 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト