arXiv reaDer
深層畳み込みニューラルネットワークのための漸近的ソフトフィルタプルーニング
Asymptotic Soft Filter Pruning for Deep Convolutional Neural Networks
より深く、より広い畳み込みニューラルネットワーク(CNN)は、優れた性能を実現するが、高価な計算コストをもたらす。このようなオーバーパラメータ化されたニューラルネットワークを高速化することが注目されている。典型的なプルーニングアルゴリズムは、訓練、プルーニング、再訓練の3段階のパイプラインである。一般的なアプローチでは、再訓練の際にプルーニングされたフィルタをゼロに固定するため、最適化空間が大幅に削減される。また、これらのアプローチでは、最初に大量のフィルタを直接プルーニングしてしまうため、復元不可能な情報損失が発生してしまうという問題がある。これらの問題を解決するために、深層ニューラルネットワークの推論手順を高速化するための漸近的ソフトフィルタプルーニング(ASFP)法を提案する。まず、再訓練の段階で、プルーニング済みのフィルタを更新する。その結果、プルーニングされたモデルの最適化空間は縮小されず、元のモデルと同じになる。このようにして、モデルは訓練データから学習するのに十分な容量を持つことになる。第二に、ネットワークを漸近的にプルーニングする。最初にいくつかのフィルタのプルーニングを行い、学習の間に漸近的にさらに多くのフィルタのプルーニングを行う。このように漸近的にプルーニングを行うと、学習データの情報が徐々に残りのフィルタに集中するため、その後の学習・プルーニング処理は安定したものになる。実験では、我々のASFPが画像分類ベンチマークにおいて有効であることを示している。特に、ILSVRC-2012において、我々のASFPはResNet-50のFLOPsを40%以上削減し、トップ5の精度低下を0.14%に抑えており、ソフトフィルタープルーニング(SFP)よりも8%高い精度を示した。
Deeper and wider Convolutional Neural Networks (CNNs) achieve superior performance but bring expensive computation cost. Accelerating such over-parameterized neural network has received increased attention. A typical pruning algorithm is a three-stage pipeline, i.e., training, pruning, and retraining. Prevailing approaches fix the pruned filters to zero during retraining, and thus significantly reduce the optimization space. Besides, they directly prune a large number of filters at first, which would cause unrecoverable information loss. To solve these problems, we propose an Asymptotic Soft Filter Pruning (ASFP) method to accelerate the inference procedure of the deep neural networks. First, we update the pruned filters during the retraining stage. As a result, the optimization space of the pruned model would not be reduced but be the same as that of the original model. In this way, the model has enough capacity to learn from the training data. Second, we prune the network asymptotically. We prune few filters at first and asymptotically prune more filters during the training procedure. With asymptotic pruning, the information of the training set would be gradually concentrated in the remaining filters, so the subsequent training and pruning process would be stable. Experiments show the effectiveness of our ASFP on image classification benchmarks. Notably, on ILSVRC-2012, our ASFP reduces more than 40% FLOPs on ResNet-50 with only 0.14% top-5 accuracy degradation, which is higher than the soft filter pruning (SFP) by 8%.
updated: Mon Nov 11 2019 02:10:29 GMT+0000 (UTC)
published: Wed Aug 22 2018 00:32:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト