arXiv reaDer
3次元からCNNを加速する:包括的な剪定フレームワーク
Accelerate CNNs from Three Dimensions: A Comprehensive Pruning Framework
フィルタレベルやレイヤーレベルのプルーニングなど、ほとんどのニューラルネットワークプルーニング方法は、計算バジェットを満たすためだけに、ネットワークモデルを1つの次元(深さ、幅、または解像度)に沿ってプルーニングします。ただし、このようなプルーニングポリシーでは、多くの場合、その次元が過度に縮小されるため、精度が大幅に低下します。この問題を軽減するために、剪定は3つの次元に沿って包括的に行われるべきであると私たちは主張します。この目的のために、私たちの剪定フレームワークは、最適化問題として剪定を定式化します。具体的には、最初に特定のモデルの精度と深さ/幅/解像度の関係を多項式回帰にキャストし、次に多項式を最大化して3次元の最適値を取得します。最後に、モデルはそれに応じて3つの最適な次元に沿って剪定されます。このフレームワークでは、回帰をトレーニングするために収集するデータが多すぎると非常に時間とコストがかかるため、コストを下げるために2つのアプローチを提案します。1)トレーニングデータが少なくても正確な回帰を保証するために多項式を特殊化する。 2)データをより速く収集するために、反復的な剪定と微調整を採用します。広範な実験により、提案されたアルゴリズムは、最先端の剪定アルゴリズム、さらにはニューラルアーキテクチャの検索ベースのアルゴリズムを上回っています。
Most neural network pruning methods, such as filter-level and layer-level prunings, prune the network model along one dimension (depth, width, or resolution) solely to meet a computational budget. However, such a pruning policy often leads to excessive reduction of that dimension, thus inducing a huge accuracy loss. To alleviate this issue, we argue that pruning should be conducted along three dimensions comprehensively. For this purpose, our pruning framework formulates pruning as an optimization problem. Specifically, it first casts the relationships between a certain model's accuracy and depth/width/resolution into a polynomial regression and then maximizes the polynomial to acquire the optimal values for the three dimensions. Finally, the model is pruned along the three optimal dimensions accordingly. In this framework, since collecting too much data for training the regression is very time-costly, we propose two approaches to lower the cost: 1) specializing the polynomial to ensure an accurate regression even with less training data; 2) employing iterative pruning and fine-tuning to collect the data faster. Extensive experiments show that our proposed algorithm surpasses state-of-the-art pruning algorithms and even neural architecture search-based algorithms.
updated: Tue Jun 15 2021 13:02:09 GMT+0000 (UTC)
published: Sat Oct 10 2020 02:30:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト