arXiv reaDer
インテリジェントエッジデバイスでの深層学習を最適化するための融合触媒プルーニング
Fusion-Catalyzed Pruning for Optimizing Deep Learning on Intelligent Edge Devices
ディープニューラルネットワークモデルの計算コストの増加は、リソースに制約のあるエッジデバイスでのインテリジェントアプリケーションの適用性を制限します。モデルを圧縮するために多くのニューラルネットワークプルーニング方法が提案されていますが、一般的なアプローチは、最適化の機会を逃す可能性のあるパラメトリック演算子(畳み込みなど)にのみ焦点を当てています。この論文では、ニューラルネットワークを加速するためにパラメトリック演算子とノンパラメトリック演算子を同時に最適化する、FuPrunerと呼ばれる新しい融合触媒プルーニングアプローチを紹介します。モデルを同等に変換する積極的な融合法を導入します。これにより、剪定の最適化空間が拡張され、パラメトリック演算子と同様の方法でノンパラメトリック演算子を剪定できます。動的フィルター剪定法を適用して、の計算コストを削減します。精度要件を維持しながらモデルを作成します。さらに、FuPrunerは、フュージョンとプルーニングを制御するための構成可能な最適化オプションを提供し、はるかに柔軟なパフォーマンスと精度のトレードオフを可能にします。 Jetson TX2、Jetson Nano、Edge TPU、NCS、およびNCS2の5つの代表的なインテリジェントエッジプラットフォームでの最先端の残差ニューラルネットワークによる評価は、CIFARでのモデルの推論を加速できるアプローチの有効性を示しています- 10およびImageNetデータセット。
The increasing computational cost of deep neural network models limits the applicability of intelligent applications on resource-constrained edge devices. While a number of neural network pruning methods have been proposed to compress the models, prevailing approaches focus only on parametric operators (e.g., convolution), which may miss optimization opportunities. In this paper, we present a novel fusion-catalyzed pruning approach, called FuPruner, which simultaneously optimizes the parametric and non-parametric operators for accelerating neural networks. We introduce an aggressive fusion method to equivalently transform a model, which extends the optimization space of pruning and enables non-parametric operators to be pruned in a similar manner as parametric operators, and a dynamic filter pruning method is applied to decrease the computational cost of models while retaining the accuracy requirement. Moreover, FuPruner provides configurable optimization options for controlling fusion and pruning, allowing much more flexible performance-accuracy trade-offs to be made. Evaluation with state-of-the-art residual neural networks on five representative intelligent edge platforms, Jetson TX2, Jetson Nano, Edge TPU, NCS, and NCS2, demonstrates the effectiveness of our approach, which can accelerate the inference of models on CIFAR-10 and ImageNet datasets.
updated: Sun Nov 29 2020 12:50:10 GMT+0000 (UTC)
published: Fri Oct 30 2020 10:10:08 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト