過去10年間で、畳み込みニューラルネットワーク(CNN)は進化して、さまざまなコンピュータービジョンタスクの主要なモデルになりましたが、メモリ要件が高く、計算コストが高いため、メモリの少ないデバイスに展開することはできません。 CNNを圧縮するための一般的で直接的なアプローチの1つは、ネットワークスリミングです。これは、トレーニング中にバッチ正規化レイヤーのチャネル関連のスケーリング係数にℓ_1ペナルティを課します。このようにして、スケーリング係数が低いチャネルは重要ではないと識別され、モデルでプルーニングされます。この論文では、ℓ_1ペナルティをℓ_pに置き換え、ℓ_1(Tℓ_1)ペナルティを変換することを提案します。これらの非凸ペナルティは、さまざまな圧縮センシング問題でよりまばらな満足のいくソリューションを生み出す点でℓ_1よりも優れているためです。数値実験では、CIFAR10 / 100でトレーニングされたVGGNetとDensenetでℓ_pとTℓ_1のペナルティを伴うネットワークスリミングを示します。結果は、非凸ペナルティがℓ_1よりもCNNをよりよく圧縮することを示しています。さらに、Tℓ_1はチャネルプルーニング後のモデルの精度を維持し、ℓ_1/ 2、3 / 4は、再トレーニング後にℓ_1と同様の精度の圧縮モデルを生成します。
In the last decade, convolutional neural networks (CNNs) have evolved to become the dominant models for various computer vision tasks, but they cannot be deployed in low-memory devices due to its high memory requirement and computational cost. One popular, straightforward approach to compressing CNNs is network slimming, which imposes an ℓ_1 penalty on the channel-associated scaling factors in the batch normalization layers during training. In this way, channels with low scaling factors are identified to be insignificant and are pruned in the models. In this paper, we propose replacing the ℓ_1 penalty with the ℓ_p and transformed ℓ_1 (Tℓ_1) penalties since these nonconvex penalties outperformed ℓ_1 in yielding sparser satisfactory solutions in various compressed sensing problems. In our numerical experiments, we demonstrate network slimming with ℓ_p and Tℓ_1 penalties on VGGNet and Densenet trained on CIFAR 10/100. The results demonstrate that the nonconvex penalties compress CNNs better than ℓ_1. In addition, Tℓ_1 preserves the model accuracy after channel pruning, and ℓ_1/2, 3/4 yield compressed models with similar accuracies as ℓ_1 after retraining.