小さなパラメーター セットを使用してネットワークを高速化および特殊化する、圧縮、タスク切り替えネットワーク アダプターのファミリーである構造化プルーニング アダプター (SPA) を提案します。具体的には、チャネル ベースおよびブロック ベースの SPA を提案し、コンピューター ビジョンと自然言語処理の両方のベンチマークで一連の剪定方法を使用してそれらを評価します。微調整を伴う通常の構造化プルーニングと比較して、当社のチャネル SPA は、90% のプルーニングされた重みで半分のパラメーターを使用しながら、平均で 6.9% 精度を向上させます。あるいは、1.6% 低い精度で 70% の剪定を行い、17 分の 1 のパラメーターで適応を学習できます。同様に、ブロック SPA に必要なパラメーターは、微調整によるプルーニングよりもはるかに少なくなります。実験的なコードとアダプターの Python ライブラリは、github.com/lukashedegaard/structured-pruning-adapters で入手できます。
We propose Structured Pruning Adapters (SPAs), a family of compressing, task-switching network adapters, that accelerate and specialize networks using tiny parameter sets. Specifically, we propose a channel- and a block-based SPA and evaluate them with a suite of pruning methods on both computer vision and natural language processing benchmarks. Compared to regular structured pruning with fine-tuning, our channel-SPA improves accuracy by 6.9% on average while using half the parameters at 90% pruned weights. Alternatively, it can learn adaptations with 17x fewer parameters at 70% pruning with 1.6% lower accuracy. Similarly, our block-SPA requires far fewer parameters than pruning with fine-tuning. Our experimental code and Python library of adapters are available at github.com/lukashedegaard/structured-pruning-adapters.