arXiv reaDer
FLIQS: ワンショット混合精度浮動小数点および整数量子化検索
FLIQS: One-Shot Mixed-Precision Floating-Point and Integer Quantization Search
量子化は、最新のディープ ニューラル ネットワーク (DNN) のモデル サイズ、計算要件、エネルギー消費を削減するための主流の圧縮手法となっています。最近のハードウェアでは、整数や浮動小数点の複数のバリアントを含む数値サポートが改善されているため、低モデル コストで高品質の結果を達成するには、混合精度の量子化が必要になりました。従来の混合精度量子化手法では、精度が犠牲になるトレーニング後の量子化検索、または分岐によるメモリ使用量の増加につながる微分可能な量子化検索が実行されていました。したがって、整数モデルと低精度浮動小数点モデルの両方での再トレーニングの必要性を排除する、最初のワンショット混合精度量子化検索を提案します。複数の畳み込みネットワークとビジョン トランスフォーマー モデルで浮動小数点および整数量子化検索 (FLIQS) を評価し、パレート最適モデルを発見します。私たちのアプローチは、均一精度、手動混合精度、および最近の整数量子化検索方法を改善するモデルを発見します。提案された整数量子化検索では、以前の方法と比較して、同等のモデルコストで ImageNet 上の ResNet-18 の精度が 1.31% ポイント、ResNet-50 の精度が 0.90% ポイント向上しました。さらに、初めて新しい混合精度浮動小数点検索を検討し、MobileNetV2 を以前の最先端の FP8 モデルと比較して最大 0.98% ポイント改善しました。最後に、結合量子化空間とニューラル アーキテクチャ空間を同時に検索するように FLIQS を拡張し、MobileNetV2 検索空間で同様のモデル コストで ImageNet の精度を 2.69% ポイント向上させます。
Quantization has become a mainstream compression technique for reducing model size, computational requirements, and energy consumption for modern deep neural networks (DNNs). With the improved numerical support in recent hardware, including multiple variants of integer and floating point, mixed-precision quantization has become necessary to achieve high-quality results with low model cost. Prior mixed-precision quantization methods have performed a post-training quantization search, which compromises on accuracy, or a differentiable quantization search, which leads to high memory usage from branching. Therefore, we propose the first one-shot mixed-precision quantization search that eliminates the need for retraining in both integer and low-precision floating point models. We evaluate our floating-point and integer quantization search (FLIQS) on multiple convolutional networks and vision transformer models to discover Pareto-optimal models. Our approach discovers models that improve upon uniform precision, manual mixed-precision, and recent integer quantization search methods. With the proposed integer quantization search, we increase the accuracy of ResNet-18 on ImageNet by 1.31% points and ResNet-50 by 0.90% points with equivalent model cost over previous methods. Additionally, for the first time, we explore a novel mixed-precision floating-point search and improve MobileNetV2 by up to 0.98% points compared to prior state-of-the-art FP8 models. Finally, we extend FLIQS to simultaneously search a joint quantization and neural architecture space and improve the ImageNet accuracy by 2.69% points with similar model cost on a MobileNetV2 search space.
updated: Mon Aug 07 2023 04:17:19 GMT+0000 (UTC)
published: Mon Aug 07 2023 04:17:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト