arXiv reaDer
マグニチュード アテンションベースの動的プルーニング
Magnitude Attention-based Dynamic Pruning
既存の枝刈り手法は、疎な構造を検索する場合にのみ、指定された基準に基づいて各重みの重要度を利用し、学習中には利用しません。この研究では、新しいアプローチであるマグニチュード アテンション ベースの動的プルーニング (MAP) 法を提案します。これは、スパース モデル構造を動的に調査するために、前方パスと後方パスの両方に重みの重要性を適用します。マグニチュード アテンションは、連続実数値としての重みの大きさに基づいて定義され、効率的な探索を促進することで冗長ネットワークから効果的な疎ネットワークへのシームレスな移行を可能にします。さらに、アテンション メカニズムにより、疎ネットワーク内の重要な層に対するより効果的な更新が保証されます。トレーニングの後半段階では、私たちのアプローチは探索から活用へと移行し、探索された構造に基づいて重要な重みで構成される疎モデルのみを更新します。その結果、密モデルと同等のパフォーマンスを達成するだけでなく、CIFAR での以前の枝刈り手法を上回る枝刈りモデルが得られます。 -10/100 および ImageNet。
Existing pruning methods utilize the importance of each weight based on specified criteria only when searching for a sparse structure but do not utilize it during training. In this work, we propose a novel approach - Magnitude Attention-based Dynamic Pruning (MAP) method, which applies the importance of weights throughout both the forward and backward paths to explore sparse model structures dynamically. Magnitude attention is defined based on the magnitude of weights as continuous real-valued numbers enabling a seamless transition from a redundant to an effective sparse network by promoting efficient exploration. Additionally, the attention mechanism ensures more effective updates for important layers within the sparse network. In later stages of training, our approach shifts from exploration to exploitation, exclusively updating the sparse model composed of crucial weights based on the explored structure, resulting in pruned models that not only achieve performance comparable to dense models but also outperform previous pruning methods on CIFAR-10/100 and ImageNet.
updated: Thu Jun 08 2023 09:20:51 GMT+0000 (UTC)
published: Thu Jun 08 2023 09:20:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト