arXiv reaDer
ネットワークプルーニング用の重み依存ゲート
Weight-dependent Gates for Network Pruning
この論文では、剪定指標、剪定率、および効率の制約の問題に同時に対処するために、単純でありながら効果的なネットワーク剪定フレームワークを提案します。この論文は、剪定の決定は畳み込みの重みに依存するべきであると主張し、したがって、フィルターの重みから情報を学習し、フィルターを自動的に剪定または維持するためのバイナリゲートを取得するための新しい重み依存ゲート(Wゲート)を提案します。効率の制約下でネットワークをプルーニングするために、切り替え可能な効率モジュールが構築され、プルーニングされた候補ネットワークのハードウェア遅延またはFLOPを予測します。提案された効率モジュールと組み合わせると、W-Gateは効率を意識した方法でフィルターの剪定を実行し、精度と効率のトレードオフが優れたコンパクトなネットワークを実現できます。 ResNet34、ResNet50、およびMobileNet V2で提案された方法の有効性を実証し、それぞれ、ImageNetでのハードウェア遅延を抑えて最大1.33 / 1.28 /1.1高いTop-1精度を達成しました。最先端の方法と比較して、W-Gatesは優れたパフォーマンスも実現します。
In this paper, a simple yet effective network pruning framework is proposed to simultaneously address the problems of pruning indicator, pruning ratio, and efficiency constraint. This paper argues that the pruning decision should depend on the convolutional weights, and thus proposes novel weight-dependent gates (W-Gates) to learn the information from filter weights and obtain binary gates to prune or keep the filters automatically. To prune the network under efficiency constraints, a switchable Efficiency Module is constructed to predict the hardware latency or FLOPs of candidate pruned networks. Combined with the proposed Efficiency Module, W-Gates can perform filter pruning in an efficiency-aware manner and achieve a compact network with a better accuracy-efficiency trade-off. We have demonstrated the effectiveness of the proposed method on ResNet34, ResNet50, and MobileNet V2, respectively achieving up to 1.33/1.28/1.1 higher Top-1 accuracy with lower hardware latency on ImageNet. Compared with state-of-the-art methods, W-Gates also achieves superior performance.
updated: Tue Jan 18 2022 17:42:02 GMT+0000 (UTC)
published: Sat Jul 04 2020 10:29:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト