arXiv reaDer
コンビナトリアル脳外科医:ニューラルネットワークで互いに打ち消し合う重みの剪定
The Combinatorial Brain Surgeon: Pruning Weights That Cancel One Another in Neural Networks
ニューラルネットワークは、結果のモデルがパラメーター化されすぎている場合でも、トレーニングが大きいほど精度が高くなる傾向があります。それでも、トレーニング前、トレーニング中、またはトレーニング後にこのような余分なパラメータを注意深く削除すると、同様の、またはさらに改善された精度のモデルが生成される場合があります。多くの場合、これは、絶対値が最小の重みのパーセンテージを削除するだけの単純なヒューリスティックによって不思議なことに達成できます。ただし、大きさは重みの関連性の完全なプロキシではありません。剪定から大幅に優れたパフォーマンスを得るには、複数の重みを削除することの複合効果を考慮する必要があるという前提で、影響ベースの剪定の古典的なアプローチの1つであるOptimal Brain Surgeon(OBS)を再検討します。 OBSの組み合わせ拡張を解決するための扱いやすいヒューリスティックを提案します。このヒューリスティックでは、同時に削除するウェイトを選択し、残りのウェイトを体系的に更新します。私たちの選択方法は、高いスパース性の下で他の方法よりも優れており、他の方法と組み合わせた場合でも、重みの更新は有利です。
Neural networks tend to achieve better accuracy with training if they are larger -- even if the resulting models are overparameterized. Nevertheless, carefully removing such excess parameters before, during, or after training may also produce models with similar or even improved accuracy. In many cases, that can be curiously achieved by heuristics as simple as removing a percentage of the weights with the smallest absolute value -- even though magnitude is not a perfect proxy for weight relevance. With the premise that obtaining significantly better performance from pruning depends on accounting for the combined effect of removing multiple weights, we revisit one of the classic approaches for impact-based pruning: the Optimal Brain Surgeon(OBS). We propose a tractable heuristic for solving the combinatorial extension of OBS, in which we select weights for simultaneous removal, as well as a systematic update of the remaining weights. Our selection method outperforms other methods under high sparsity, and the weight update is advantageous even when combined with the other methods.
updated: Sun Jun 19 2022 23:53:13 GMT+0000 (UTC)
published: Wed Mar 09 2022 00:58:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト