この論文では、ターゲットの枝刈り率制約を遵守しながら出力歪みの最小化を最適化するという課題に対処する、ディープ ニューラル ネットワーク (DNN) 向けの新しい層適応重み枝刈りアプローチを提案します。私たちのアプローチでは、すべてのレイヤーの集合的な影響を考慮して、レイヤー適応型枝刈りスキームを設計します。私たちは、複数のレイヤーの重みを枝刈りすることによって引き起こされる出力歪みの非常に重要な相加性特性を発見し、利用します。この特性により、枝刈りを組み合わせ最適化問題として定式化し、動的プログラミングを通じて効率的に解くことができます。問題をサブ問題に分解することで、線形時間計算量が達成され、最適化アルゴリズムが高速になり、CPU 上で実行可能になります。私たちの広範な実験により、ImageNet および CIFAR-10 データセットにおける既存の手法に対する私たちのアプローチの優位性が実証されました。 CIFAR-10 では、私たちの手法は顕著な改善を達成し、トップ 1 の精度に関して、ResNet-32 で最大 1.0%、VGG-16 で 0.5%、DenseNet-121 で最大 0.7% 他の手法を上回りました。 ImageNet では、VGG-16 および ResNet-50 の他の方法と比較して、それぞれ最大 4.7% および 4.6% 高いトップ 1 精度を達成します。これらの結果は、レイヤー適応重み枝刈りを通じて DNN パフォーマンスを向上させるためのアプローチの有効性と実用性を強調しています。コードは https://github.com/Akimoto-Cris/RD_VIT_PRUNE で入手できます。
In this paper, we propose a novel layer-adaptive weight-pruning approach for Deep Neural Networks (DNNs) that addresses the challenge of optimizing the output distortion minimization while adhering to a target pruning ratio constraint. Our approach takes into account the collective influence of all layers to design a layer-adaptive pruning scheme. We discover and utilize a very important additivity property of output distortion caused by pruning weights on multiple layers. This property enables us to formulate the pruning as a combinatorial optimization problem and efficiently solve it through dynamic programming. By decomposing the problem into sub-problems, we achieve linear time complexity, making our optimization algorithm fast and feasible to run on CPUs. Our extensive experiments demonstrate the superiority of our approach over existing methods on the ImageNet and CIFAR-10 datasets. On CIFAR-10, our method achieves remarkable improvements, outperforming others by up to 1.0% for ResNet-32, 0.5% for VGG-16, and 0.7% for DenseNet-121 in terms of top-1 accuracy. On ImageNet, we achieve up to 4.7% and 4.6% higher top-1 accuracy compared to other methods for VGG-16 and ResNet-50, respectively. These results highlight the effectiveness and practicality of our approach for enhancing DNN performance through layer-adaptive weight pruning. Code will be available on https://github.com/Akimoto-Cris/RD_VIT_PRUNE.