arXiv reaDer
空間間剪定:適応フィルター表現を使用してスパースCNNのトレーニングを改善する
Interspace Pruning: Using Adaptive Filter Representations to Improve Training of Sparse CNNs
非構造化プルーニングは、トレーニング時と推論時の両方で、畳み込みニューラルネットワーク(CNN)のメモリフットプリントを削減するのに適しています。 CNNには、K×Kフィルターに配置されたパラメーターが含まれています。標準の非構造化プルーニング(SP)は、フィルター要素をゼロに設定することでCNNのメモリーフットプリントを削減し、それによってフィルターを制約する固定部分空間を指定します。特に、剪定がトレーニング前またはトレーニング中に適用される場合、これは強いバイアスを引き起こします。これを克服するために、既存の剪定方法を改善するための一般的なツールである空間間剪定(IP)を導入します。これは、基礎となる適応フィルター基底(FB)の線形結合によって動的空間で表されるフィルターを使用します。 IPの場合、剪定されていない係数とFBが一緒にトレーニングされている間、FB係数はゼロに設定されます。この作業では、IPの優れたパフォーマンスの数学的証拠を提供し、テストされたすべての最先端の非構造化剪定方法でIPがSPよりも優れていることを示します。特に、ImageNetのプルーニングや高スパース性へのプルーニングなどの困難な状況では、IPはSPを大幅に上回り、ランタイムとパラメーターのコストは等しくなります。最後に、IPの進歩は、トレーニング性の向上と優れた一般化能力によるものであることを示します。
Unstructured pruning is well suited to reduce the memory footprint of convolutional neural networks (CNNs), both at training and inference time. CNNs contain parameters arranged in K ×K filters. Standard unstructured pruning (SP) reduces the memory footprint of CNNs by setting filter elements to zero, thereby specifying a fixed subspace that constrains the filter. Especially if pruning is applied before or during training, this induces a strong bias. To overcome this, we introduce interspace pruning (IP), a general tool to improve existing pruning methods. It uses filters represented in a dynamic interspace by linear combinations of an underlying adaptive filter basis (FB). For IP, FB coefficients are set to zero while un-pruned coefficients and FBs are trained jointly. In this work, we provide mathematical evidence for IP's superior performance and demonstrate that IP outperforms SP on all tested state-of-the-art unstructured pruning methods. Especially in challenging situations, like pruning for ImageNet or pruning to high sparsity, IP greatly exceeds SP with equal runtime and parameter costs. Finally, we show that advances of IP are due to improved trainability and superior generalization ability.
updated: Tue Mar 15 2022 11:50:45 GMT+0000 (UTC)
published: Tue Mar 15 2022 11:50:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト