arXiv reaDer
深層学習のためのオプティマイザーの経験的比較について
On Empirical Comparisons of Optimizers for Deep Learning
オプティマイザーの選択は、現代の深層学習パイプラインの中心的なステップです。このホワイトペーパーでは、ハイパーパラメーターチューニングプロトコルに対するオプティマイザー比較の感度を示します。私たちの調査結果は、ハイパーパラメーター検索空間が文献における最近の経験的比較によって得られたランキングを説明する単一の最も重要な要因である可能性があることを示唆しています。実際、ハイパーパラメーター検索スペースが変更されると、これらの結果が矛盾する可能性があることを示しています。チューニングの努力が際限なく拡大するにつれて、より一般的なオプティマイザーは近似できるパフォーマンスを決して下回ってはなりません(つまり、Adamは運動量よりも悪くなることはありません)。包含を壊す方法。実験では、オプティマイザー間の包含関係が実際に重要であり、オプティマイザーの比較を常に予測することがわかりました。特に、一般的な適応勾配法は運動量または勾配降下を決して下回らないことがわかります。また、適応勾配法のハイパーパラメーターをしばしば無視するチューニングに関する実用的なヒントを報告し、ニューラルネットワークトレーニングのオプティマイザーの公正なベンチマークに関する懸念を提起します。
Selecting an optimizer is a central step in the contemporary deep learning pipeline. In this paper, we demonstrate the sensitivity of optimizer comparisons to the hyperparameter tuning protocol. Our findings suggest that the hyperparameter search space may be the single most important factor explaining the rankings obtained by recent empirical comparisons in the literature. In fact, we show that these results can be contradicted when hyperparameter search spaces are changed. As tuning effort grows without bound, more general optimizers should never underperform the ones they can approximate (i.e., Adam should never perform worse than momentum), but recent attempts to compare optimizers either assume these inclusion relationships are not practically relevant or restrict the hyperparameters in ways that break the inclusions. In our experiments, we find that inclusion relationships between optimizers matter in practice and always predict optimizer comparisons. In particular, we find that the popular adaptive gradient methods never underperform momentum or gradient descent. We also report practical tips around tuning often ignored hyperparameters of adaptive gradient methods and raise concerns about fairly benchmarking optimizers for neural network training.
updated: Sat Jan 04 2020 05:28:34 GMT+0000 (UTC)
published: Fri Oct 11 2019 23:51:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト