arXiv reaDer
整数ベースのセマンティックセグメンテーションネットワークのトレーニングと推論
Training and Inference for Integer-Based Semantic Segmentation Network
セマンティックセグメンテーションは、近年、研究および産業における主要なトピックとなっています。ただし、ピクセル単位の予測とバックプロパゲーションアルゴリズムの計算が複雑なため、セマンティックセグメンテーションは計算リソースで要求されており、トレーニングと推論の速度が遅くなり、モデルを格納するためのストレージスペースが大きくなります。セグメンテーションネットワークを高速化する既存のスキームは、ネットワーク構造を変更し、顕著な精度の低下を伴います。ただし、ニューラルネットワークの量子化を使用すると、同等の精度と元のネットワーク構造を維持しながら、計算負荷を軽減できます。セマンティックセグメンテーションネットワークは、多くの点で従来のディープ畳み込みニューラルネットワーク(DCNN)とは異なり、このトピックは既存の作業では十分に検討されていません。この論文では、セグメンテーションネットワークのトレーニングと推論のための新しい量子化フレームワークを提案します。このフレームワークでは、パラメータと操作が初めて8ビット整数ベースの値に制限されます。データフローの完全な量子化と、バッチ正規化での平方演算とルート演算の削除により、フレームワークは固定小数点デバイスで推論を実行できるようになります。提案されたフレームワークは、FCN-VGG16やDeepLabv3-ResNet50などの主流のセマンティックセグメンテーションネットワークで評価され、ADE20KデータセットおよびPASCAL VOC2012データセットの浮動小数点フレームワークと同等の精度を実現します。
Semantic segmentation has been a major topic in research and industry in recent years. However, due to the computation complexity of pixel-wise prediction and backpropagation algorithm, semantic segmentation has been demanding in computation resources, resulting in slow training and inference speed and large storage space to store models. Existing schemes that speed up segmentation network change the network structure and come with noticeable accuracy degradation. However, neural network quantization can be used to reduce computation load while maintaining comparable accuracy and original network structure. Semantic segmentation networks are different from traditional deep convolutional neural networks (DCNNs) in many ways, and this topic has not been thoroughly explored in existing works. In this paper, we propose a new quantization framework for training and inference of segmentation networks, where parameters and operations are constrained to 8-bit integer-based values for the first time. Full quantization of the data flow and the removal of square and root operations in batch normalization give our framework the ability to perform inference on fixed-point devices. Our proposed framework is evaluated on mainstream semantic segmentation networks like FCN-VGG16 and DeepLabv3-ResNet50, achieving comparable accuracy against floating-point framework on ADE20K dataset and PASCAL VOC 2012 dataset.
updated: Mon Nov 30 2020 02:07:07 GMT+0000 (UTC)
published: Mon Nov 30 2020 02:07:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト