arXiv reaDer
構造化プルーニング アダプター
Structured Pruning Adapters
小さなパラメーター セットを使用してネットワークを高速化および特殊化する、圧縮、タスク切り替えネットワーク アダプターのファミリーである構造化プルーニング アダプター (SPA) を提案します。具体的には、チャネル ベースおよびブロック ベースの SPA を提案し、コンピューター ビジョンと自然言語処理の両方のベンチマークで一連の剪定方法を使用してそれらを評価します。微調整を伴う通常の構造化プルーニングと比較して、当社のチャネル SPA は、90% のプルーニングされた重みで半分のパラメーターを使用しながら、平均で 6.9% 精度を向上させます。あるいは、1.6% 低い精度で 70% の剪定を行い、17 分の 1 のパラメーターで適応を学習できます。同様に、ブロック SPA に必要なパラメーターは、微調整によるプルーニングよりもはるかに少なくなります。実験的なコードとアダプターの Python ライブラリは、github.com/lukashedegaard/structured-pruning-adapters で入手できます。
We propose Structured Pruning Adapters (SPAs), a family of compressing, task-switching network adapters, that accelerate and specialize networks using tiny parameter sets. Specifically, we propose a channel- and a block-based SPA and evaluate them with a suite of pruning methods on both computer vision and natural language processing benchmarks. Compared to regular structured pruning with fine-tuning, our channel-SPA improves accuracy by 6.9% on average while using half the parameters at 90% pruned weights. Alternatively, it can learn adaptations with 17x fewer parameters at 70% pruning with 1.6% lower accuracy. Similarly, our block-SPA requires far fewer parameters than pruning with fine-tuning. Our experimental code and Python library of adapters are available at github.com/lukashedegaard/structured-pruning-adapters.
updated: Mon Nov 21 2022 08:10:53 GMT+0000 (UTC)
published: Thu Nov 17 2022 09:03:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト