arXiv reaDer
宝くじの健全性チェック:当選したチケットは本当にジャックポットを獲得しますか?
Sanity Checks for Lottery Tickets: Does Your Winning Ticket Really Win the Jackpot?
実験のセットアップと文献の「当選チケット」を特定するための基準については、長年の論争と矛盾がありました。これを調整するために、包括的でより厳密な条件で、宝くじの仮説の定義を再検討します。新しい定義では、主要なDNNアーキテクチャやアプリケーション全体に当選チケットが存在するかどうかを明確にするための具体的な証拠を示します。広範な実験を通じて、当選チケットとさまざまな実験的要因との相関関係について定量分析を行い、観察のパターンを実験的に研究します。学習率やトレーニングエポックなどの主要なトレーニングハイパーパラメータ、および容量や残りの接続などのアーキテクチャ特性はすべて、当選チケットを特定できるかどうか、いつ特定できるかと高い相関関係があることがわかります。私たちの分析に基づいて、特定のアーキテクチャ特性に関するパラメータ設定のガイドラインを要約します。これは、宝くじの仮説のトピックに関する研究の進歩を促進することを望んでいます。
There have been long-standing controversies and inconsistencies over the experiment setup and criteria for identifying the "winning ticket" in literature. To reconcile such, we revisit the definition of lottery ticket hypothesis, with comprehensive and more rigorous conditions. Under our new definition, we show concrete evidence to clarify whether the winning ticket exists across the major DNN architectures and/or applications. Through extensive experiments, we perform quantitative analysis on the correlations between winning tickets and various experimental factors, and empirically study the patterns of our observations. We find that the key training hyperparameters, such as learning rate and training epochs, as well as the architecture characteristics such as capacities and residual connections, are all highly correlated with whether and when the winning tickets can be identified. Based on our analysis, we summarize a guideline for parameter settings in regards of specific architecture characteristics, which we hope to catalyze the research progress on the topic of lottery ticket hypothesis.
updated: Wed Oct 06 2021 17:36:38 GMT+0000 (UTC)
published: Thu Jul 01 2021 01:27:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト