arXiv reaDer
ネットワーク スパース性における勾配駆動基準の最適化
Optimizing Gradient-driven Criteria in Network Sparsity
ネットワークのスパース性は、主にネットワークの複雑さを軽減する機能により人気があります。広範な研究により、勾配駆動型のスパース性が発掘されています。通常、これらの手法は重みの独立性を前提に構築されていますが、これは重みが相互に影響し合うという事実に反しています。したがって、それらのパフォーマンスはまだ改善されていません。この論文では、この独立性のパラドックスを解決することにより、勾配駆動スパース性 (OptG) を最適化することを提案します。私たちの動機は、重みを変更せずにマスク値を更新するだけで、高性能のスパース サブネットワークを特定できることを示すスーパーマスク トレーニングの最近の進歩に由来しています。スーパーマスクトレーニングは、削除された重みと保存された重みの両方の勾配駆動型スパース性の基準を蓄積することであり、独立性のパラドックスを部分的に解決できることを証明します。その結果、OptG はスーパーマスク トレーニングを勾配主導のスパース性に統合し、独立性のパラドックスを包括的に軽減するために、新しいスーパーマスク オプティマイザーがさらに提案されます。実験によると、OptG は、特に超高スパース レベルで、多くの既存の最先端の競合他社をはるかに凌駕できることが示されています。コードは https://github.com/zyxxmu/OptG で入手できます。
Network sparsity receives popularity mostly due to its capability to reduce the network complexity. Extensive studies excavate gradient-driven sparsity. Typically, these methods are constructed upon premise of weight independence, which however, is contrary to the fact that weights are mutually influenced. Thus, their performance remains to be improved. In this paper, we propose to optimize gradient-driven sparsity (OptG) by solving this independence paradox. Our motive comes from the recent advances in supermask training which shows that high-performing sparse subnetworks can be located by simply updating mask values without modifying any weight. We prove that supermask training is to accumulate the criteria of gradient-driven sparsity for both removed and preserved weights, and it can partly solve the independence paradox. Consequently, OptG integrates supermask training into gradient-driven sparsity, and a novel supermask optimizer is further proposed to comprehensively mitigate the independence paradox. Experiments show that OptG can well surpass many existing state-of-the-art competitors, especially at ultra-high sparsity levels. Our code is available at https://github.com/zyxxmu/OptG.
updated: Sat Nov 19 2022 04:50:18 GMT+0000 (UTC)
published: Sun Jan 30 2022 14:15:49 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト