arXiv reaDer
初期化時の枝刈り -- スケッチの視点
Pruning at Initialization -- A Sketching Perspective
宝くじ仮説 (LTH) により、初期化時のニューラル ネットワークの枝刈りに対する注目が高まっています。この問題を線形設定で研究します。初期化時にスパースマスクを見つけることは、効率的な行列乗算のために導入されたスケッチ問題と同等であることを示します。これにより、LTH 問題を分析し、洞察を得るツールが得られます。具体的には、初期化時に見つかったマスクを使用して、トレーニングの終了時に枝刈りされた線形モデルの近似誤差を制限しました。我々は、疎ネットワークの検索がデータに依存しない可能性があるという以前の経験的証拠を理論的に正当化します。スケッチ パースペクティブを使用することで、初期化時の枝刈りのための既存のアルゴリズムに対する一般的な改善を提案します。これは、データに依存しない場合に有益であることがわかります。
The lottery ticket hypothesis (LTH) has increased attention to pruning neural networks at initialization. We study this problem in the linear setting. We show that finding a sparse mask at initialization is equivalent to the sketching problem introduced for efficient matrix multiplication. This gives us tools to analyze the LTH problem and gain insights into it. Specifically, using the mask found at initialization, we bound the approximation error of the pruned linear model at the end of training. We theoretically justify previous empirical evidence that the search for sparse networks may be data independent. By using the sketching perspective, we suggest a generic improvement to existing algorithms for pruning at initialization, which we show to be beneficial in the data-independent case.
updated: Sat May 27 2023 19:22:25 GMT+0000 (UTC)
published: Sat May 27 2023 19:22:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト