arXiv reaDer
Gator:ゲーティングを使用したニューラルネットワークのカスタマイズ可能なチャネルプルーニング
Gator: Customizable Channel Pruning of Neural Networks with Gating
ニューラルネットワーク(NN)アプリケーションの台頭により、圧縮への関心が高まり、特に追加のハードウェアを必要としないチャネルプルーニングに重点が置かれています。ほとんどのプルーニング方法では、シングルレイヤー操作またはグローバルスキームのいずれかを使用して、削除するチャネルを決定し、その後ネットワークを微調整します。この論文では、個々のチャネルを剪定するために学習したゲーティングメカニズムを一時的に追加し、メモリによる計算コストの削減を目的とした追加の補助損失でトレーニングされるチャネル剪定方法であるGatorを紹介します。 FLOPの条件)、および実用的なハードウェア固有の高速化。 Gatorは、NNレイヤー間の依存関係の新しい定式化を導入します。これは、以前のほとんどの方法とは対照的に、ResNetの高速道路上のレイヤーなどの非順次部分のプルーニング、さらにはResNetブロック全体の削除を可能にします。 ImageNetでトレーニングされたResNet-50に対するGatorの剪定は、最新の(SOTA)結果を生成します。たとえば、トップ5の精度がわずか0.4%低下し、FLOPが50%削減されます。また、Gatorは、実行速度が1.4倍になるため、GPUレイテンシーの点で以前のプルーニングモデルよりも優れています。さらに、Gatorは、同様のランタイムで、MobileNetV2およびSqueezeNetと比較して、改善された上位5つの精度の結果を達成します。この作業のソースコードは、https://github.com/EliPassov/gatorで入手できます。
The rise of neural network (NN) applications has prompted an increased interest in compression, with a particular focus on channel pruning, which does not require any additional hardware. Most pruning methods employ either single-layer operations or global schemes to determine which channels to remove followed by fine-tuning of the network. In this paper we present Gator, a channel-pruning method which temporarily adds learned gating mechanisms for pruning of individual channels, and which is trained with an additional auxiliary loss, aimed at reducing the computational cost due to memory, (theoretical) speedup (in terms of FLOPs), and practical, hardware-specific speedup. Gator introduces a new formulation of dependencies between NN layers which, in contrast to most previous methods, enables pruning of non-sequential parts, such as layers on ResNet's highway, and even removing entire ResNet blocks. Gator's pruning for ResNet-50 trained on ImageNet produces state-of-the-art (SOTA) results, such as 50% FLOPs reduction with only 0.4%-drop in top-5 accuracy. Also, Gator outperforms previous pruning models, in terms of GPU latency by running 1.4 times faster. Furthermore, Gator achieves improved top-5 accuracy results, compared to MobileNetV2 and SqueezeNet, for similar runtimes. The source code of this work is available at: https://github.com/EliPassov/gator.
updated: Wed Jun 01 2022 08:42:05 GMT+0000 (UTC)
published: Mon May 30 2022 20:07:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト