arXiv reaDer
CATRO: クラスアウェア トレース比率最適化によるチャネル プルーニング
CATRO: Channel Pruning via Class-Aware Trace Ratio Optimization
深い畳み込みニューラル ネットワークは、多くのアプリケーション シナリオにおいて、パラメトリックおよび計算の冗長性が高いため過剰であることが示されており、軽量で効率的なネットワークを得るためにモデルの刈り込みを検討する研究が増えています。ただし、ほとんどの既存のプルーニング アプローチは、経験に基づくヒューリスティックに基づいており、チャネルの共同影響をほとんど考慮していないため、パフォーマンスが保証されておらず、最適化されていません。このホワイト ペーパーでは、計算負荷を軽減し、モデルの推論を加速するために、Class-Aware Trace Ratio Optimization (CATRO) を介した新しいチャネル プルーニング方法を提案します。 CATRO は、いくつかのサンプルからのクラス情報を利用して、特徴空間の識別によって複数のチャネルの共同影響を測定し、保存されたチャネルの層ごとの影響を統合します。 CATRO は、サブモジュラー集合関数最大化問題としてチャネル プルーニングを定式化することにより、2 段階の貪欲な反復最適化手順によって効率的に解決します。さらに重要なことは、CATRO の収束とプルーニングされたネットワークのパフォーマンスに関する理論的正当性を提示することです。実験結果は、CATRO が他の最先端のチャネル プルーニング アルゴリズムよりも、同様の計算コストでより高い精度、または同様の精度でより低い計算コストを達成することを示しています。さらに、そのクラス認識特性により、CATRO は、さまざまな分類サブタスクに合わせて効率的なネットワークを適応的にプルーニングするのに適しており、実世界のアプリケーションでのディープ ネットワークの便利な展開と使用を強化します。
Deep convolutional neural networks are shown to be overkill with high parametric and computational redundancy in many application scenarios, and an increasing number of works have explored model pruning to obtain lightweight and efficient networks. However, most existing pruning approaches are driven by empirical heuristic and rarely consider the joint impact of channels, leading to unguaranteed and suboptimal performance. In this paper, we propose a novel channel pruning method via Class-Aware Trace Ratio Optimization (CATRO) to reduce the computational burden and accelerate the model inference. Utilizing class information from a few samples, CATRO measures the joint impact of multiple channels by feature space discriminations and consolidates the layer-wise impact of preserved channels. By formulating channel pruning as a submodular set function maximization problem, CATRO solves it efficiently via a two-stage greedy iterative optimization procedure. More importantly, we present theoretical justifications on convergence of CATRO and performance of pruned networks. Experimental results demonstrate that CATRO achieves higher accuracy with similar computation cost or lower computation cost with similar accuracy than other state-of-the-art channel pruning algorithms. In addition, because of its class-aware property, CATRO is suitable to prune efficient networks adaptively for various classification subtasks, enhancing handy deployment and usage of deep networks in real-world applications.
updated: Thu Mar 30 2023 05:05:23 GMT+0000 (UTC)
published: Thu Oct 21 2021 06:26:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト