arXiv reaDer
ランダムバイアスの初期化により、量子化されたトレーニングが改善されます
Random Bias Initialization Improves Quantized Training
 バイナリニューラルネットワークは、大きなマージンを持つ深いモデルの計算効率を向上させます。ただし、完全な精度のトレーニングとバイナリトレーニングの成功には、依然としてパフォーマンスのギャップがあります。この精度の低下がなぜ存在するのかについていくつかの洞察をもたらし、バイナリネットワークジオメトリの理解を深める必要があります。まず、ReLUをアクティブ化して完全精度のニューラルネットワークを分析し、2値化バージョンと比較します。この比較は、ランダムバイアスでネットワークを初期化することを示唆しています。これは、直感に反する方法です。
Binary neural networks improve computationally efficiency of deep models with a large margin. However, there is still a performance gap between a successful full-precision training and binary training. We bring some insights about why this accuracy drop exists and call for a better understanding of binary network geometry. We start with analyzing full-precision neural networks with ReLU activation and compare it with its binarized version. This comparison suggests to initialize networks with random bias, a counter-intuitive remedy.
updated: Mon Apr 20 2020 19:50:23 GMT+0000 (UTC)
published: Mon Sep 30 2019 04:01:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト