arXiv reaDer
ネットワークスリム化のための近似アルゴリズム
A Proximal Algorithm for Network Slimming
畳み込みニューラル ネットワーク (CNN) の一般的なチャネル プルーニング手法として、ネットワーク スリミング (NS) には 3 段階のプロセスがあります。(1) バッチ正規化層のスケーリング係数に適用される ℓ_1 正則化を使用して CNN をトレーニングします。 (2) スケーリング係数が選択されたしきい値を下回るチャネルを削除します。 (3) 枝刈りされたモデルを再トレーニングして、元の精度を回復します。この時間のかかる 3 ステップのプロセスは、部分勾配降下法を使用して CNN をトレーニングした結果です。部分勾配降下法では CNN がまばらで正確な構造に向けて正確にトレーニングされるわけではないため、後の 2 つのステップが必要です。さらに、緩勾配降下には収束の保証はありません。したがって、我々は近位 NS と呼ばれる代替アルゴリズムを開発します。私たちが提案するアルゴリズムは、CNN をまばらで正確な構造に向けてトレーニングするため、スケーリング係数のしきい値を特定する必要はなく、枝刈りされた CNN の微調整はオプションです。 Kurdyka-\Lojasiewicz の仮定を使用して、近位 NS の大域的収束を確立します。最後に、CIFAR 10/100 上の VGGNet、DenseNet、および ResNet で提案されたアルゴリズムの有効性を検証します。私たちの実験では、1 ラウンドのトレーニングの後、近位 NS が競合する精度と圧縮を備えた CNN を生成することを示しています。
As a popular channel pruning method for convolutional neural networks (CNNs), network slimming (NS) has a three-stage process: (1) it trains a CNN with ℓ_1 regularization applied to the scaling factors of the batch normalization layers; (2) it removes channels whose scaling factors are below a chosen threshold; and (3) it retrains the pruned model to recover the original accuracy. This time-consuming, three-step process is a result of using subgradient descent to train CNNs. Because subgradient descent does not exactly train CNNs towards sparse, accurate structures, the latter two steps are necessary. Moreover, subgradient descent does not have any convergence guarantee. Therefore, we develop an alternative algorithm called proximal NS. Our proposed algorithm trains CNNs towards sparse, accurate structures, so identifying a scaling factor threshold is unnecessary and fine tuning the pruned CNNs is optional. Using Kurdyka-\Lojasiewicz assumptions, we establish global convergence of proximal NS. Lastly, we validate the efficacy of the proposed algorithm on VGGNet, DenseNet and ResNet on CIFAR 10/100. Our experiments demonstrate that after one round of training, proximal NS yields a CNN with competitive accuracy and compression.
updated: Sun Jul 02 2023 23:34:12 GMT+0000 (UTC)
published: Sun Jul 02 2023 23:34:12 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト