ネットワークプルーニングは、ディープニューラルネットワークを圧縮するための有望な手段です。プルーニングへの典型的なアプローチは、モデルのトレーニングから始まり、学習したものへの影響を最小限に抑えながら冗長なパラメーターを削除します。あるいは、最近のアプローチでは、接続感度と呼ばれる顕著性基準に基づいて、トレーニングの前の初期化時にプルーニングを実行できることが示されています。ただし、トレーニングされていないランダムに初期化されたニューラルネットワークのプルーニングが効果的である理由は正確には不明です。この作業では、接続感度を勾配の形式として記録することにより、初期化条件を正式に特徴づけ、信頼性の高い接続感度測定を保証します。これにより、効果的なプルーニング結果が得られます。さらに、得られた剪定ネットワークの信号伝搬特性を分析し、簡単でデータのない方法を導入して、トレーニング性を改善します。初期化メソッドでの既存のプルーニングに対する変更により、イメージ分類タスクのすべてのテスト済みネットワークモデルで結果が改善されます。さらに、プルーニングの監視の効果を経験的に研究し、非伝搬プルーニングと組み合わせた信号伝搬の観点が、プルーニングが非標準の任意に設計されたアーキテクチャに適用されるさまざまなシナリオで役立つことを示します。
Network pruning is a promising avenue for compressing deep neural networks. A typical approach to pruning starts by training a model and then removing redundant parameters while minimizing the impact on what is learned. Alternatively, a recent approach shows that pruning can be done at initialization prior to training, based on a saliency criterion called connection sensitivity. However, it remains unclear exactly why pruning an untrained, randomly initialized neural network is effective. In this work, by noting connection sensitivity as a form of gradient, we formally characterize initialization conditions to ensure reliable connection sensitivity measurements, which in turn yields effective pruning results. Moreover, we analyze the signal propagation properties of the resulting pruned networks and introduce a simple, data-free method to improve their trainability. Our modifications to the existing pruning at initialization method lead to improved results on all tested network models for image classification tasks. Furthermore, we empirically study the effect of supervision for pruning and demonstrate that our signal propagation perspective, combined with unsupervised pruning, can be useful in various scenarios where pruning is applied to non-standard arbitrarily-designed architectures.