arXiv reaDer
どこから始めればいいですか?ディープニューラルネットワークの量子化された動作に対する重み初期化の影響の低レベルの調査
Where Should We Begin? A Low-Level Exploration of Weight Initialization Impact on Quantized Behaviour of Deep Neural Networks
モバイル処理のための深い畳み込みニューラルネットワーク(CNN)アルゴリズムの急増に伴い、限られた精度の量子化がCNN効率にとって不可欠なツールになりました。その結果、さまざまな研究が、量子化によって引き起こされるパフォーマンスの低下を最小限に抑える、固定精度の量子化アルゴリズムと量子化に焦点を合わせた最適化手法を設計しようと努めてきました。ただし、さまざまなCNN設計の決定/ベストプラクティスが量子化された推論の動作にどのように影響するかについての具体的な理解はほとんどありません。重みの初期化戦略は、勾配の消失/爆発などの問題の解決に関連していることがよくありますが、見落とされがちな側面は、各層の最終的なトレーニング済み分布への影響です。さまざまなCNNアーキテクチャの重みとアクティブ化の最終的な分布に対する、さまざまな重みの初期化の影響に関する詳細で詳細なアブレーション研究を紹介します。きめ細かい層ごとの分析により、初期の重み分布が最終的な精度と量子化された動作にどのように影響するかについての深い洞察を得ることができます。私たちの知る限り、重みの初期化とその量子化された動作への影響について、このような低レベルで詳細な定量分析を行ったのは私たちが初めてです。
With the proliferation of deep convolutional neural network (CNN) algorithms for mobile processing, limited precision quantization has become an essential tool for CNN efficiency. Consequently, various works have sought to design fixed precision quantization algorithms and quantization-focused optimization techniques that minimize quantization induced performance degradation. However, there is little concrete understanding of how various CNN design decisions/best practices affect quantized inference behaviour. Weight initialization strategies are often associated with solving issues such as vanishing/exploding gradients but an often-overlooked aspect is their impact on the final trained distributions of each layer. We present an in-depth, fine-grained ablation study of the effect of different weights initializations on the final distributions of weights and activations of different CNN architectures. The fine-grained, layerwise analysis enables us to gain deep insights on how initial weights distributions will affect final accuracy and quantized behaviour. To our best knowledge, we are the first to perform such a low-level, in-depth quantitative analysis of weights initialization and its effect on quantized behaviour.
updated: Mon Nov 30 2020 06:54:28 GMT+0000 (UTC)
published: Mon Nov 30 2020 06:54:28 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト