arXiv reaDer
3次元からCNNを加速する:包括的な剪定フレームワーク
Accelerate CNNs from Three Dimensions: A Comprehensive Pruning Framework
ニューラルネットワークのプルーニングは、モデルアクセラレーションの最も一般的な方法の1つです。フィルタレベルまたはレイヤーレベルのプルーニングなどのほとんどのプルーニング方法は、計算コストの要件を満たすために、モデルを1つの単一の次元(深さ、幅、または解像度)に沿ってプルーニングします。ただし、このようなプルーニングポリシーでは、多くの場合、その次元が過度に縮小されるため、精度が大幅に低下します。この問題を軽減するために、剪定は3つの次元に沿って包括的に行われるべきであると主張します。この目的のために、私たちの剪定フレームワークは、最適化問題として剪定を定式化します。具体的には、最初に多項式回帰を介してモデルの精度と深さ/幅/解像度の関係を適合させ、次に多項式を最大化して3次元の最適値を取得します。最後に、モデルはそれに応じて3次元に沿って剪定されます。このフレームワークでは、回帰に使用されるデータの収集に非常に時間とコストがかかるため、コストを下げるために2つのアプローチを提案します。(1)多項式を特殊化して、少ないデータでも正確な回帰を保証します。 (2)データをより速く収集するために、反復的な剪定と微調整を採用します。広範な実験により、私たちのアルゴリズムは、最先端の剪定やNASベースのアルゴリズムよりも優れていることが示されています。
Neural network pruning is one of the most popular methods for model acceleration. Most pruning methods, such as filter-level or layer-level pruning, prune the model along one single dimension (depth, width, or resolution) to meet a computational cost requirement. However, such pruning policy often leads to excessive reduction of that dimension, thus inducing a huge accuracy loss. To alleviate this issue, we argue that pruning should be done along three dimensions comprehensively. For this purpose, our pruning framework formulates pruning as an optimization problem. Specifically, it first fits the relations between the model's accuracy and depth/width/resolution via polynomial regression and then maximizes the polynomial to acquire optimal values for three dimensions. Finally, the model is pruned along three dimensions accordingly. In this framework, since collecting too much data used for the regression is very time-costly, we propose two approaches to lower the cost: (1) specializing the polynomial to ensure an accurate regression even with less data; (2) employing iterative pruning and fine-tuning to collect data faster. Extensive experiments show that our algorithm outperforms state-of-the-art pruning and even NAS-based algorithms.
updated: Sun Feb 07 2021 03:32:54 GMT+0000 (UTC)
published: Sat Oct 10 2020 02:30:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト