arXiv reaDer
動的バッチ適応
Dynamic Batch Adaptation
現在のディープ ラーニング アダプティブ オプティマイザー メソッドは、各パラメーターで使用される有効な学習率を変更することで、パラメーター更新のステップの大きさを調整します。バッチ サイズと更新ステップの大きさの学習率との間の既知の反比例関係に動機付けられて、現在の更新ステップの次元と構成を動的に決定する新しいトレーニング手順を紹介します。私たちの手順である動的バッチ適応 (DBA) は、すべてのサンプルの勾配を分析し、ネットワークの各レイヤーの勾配分散などの特定のメトリックを最適に改善するサブセットを選択します。 DBA によってモデルの収束速度が大幅に向上することを示す結果を示します。さらに、DBA は、収束速度に加えて、モデルの一般化を大幅に改善し、わずか 1% を使用して単一の完全に接続された隠れ層を使用してネットワークをトレーニングすることに成功した場合、標準のオプティマイザーよりも大幅に改善されることがわかりました。 97.79% のテスト精度に到達する MNIST データセットの。さらに極端なシナリオでは、クラスごとにわずか 10 個のサンプルを使用して、97.44% のテスト精度に到達することができます。これらの結果は、標準のオプティマイザーである確率的勾配降下法 (SGD) および Adam と比較して、それぞれ 81.78% および 88.07% の相対的なエラー率の減少を表しています。
Current deep learning adaptive optimizer methods adjust the step magnitude of parameter updates by altering the effective learning rate used by each parameter. Motivated by the known inverse relation between batch size and learning rate on update step magnitudes, we introduce a novel training procedure that dynamically decides the dimension and the composition of the current update step. Our procedure, Dynamic Batch Adaptation (DBA) analyzes the gradients of every sample and selects the subset that best improves certain metrics such as gradient variance for each layer of the network. We present results showing DBA significantly improves the speed of model convergence. Additionally, we find that DBA produces an increased improvement over standard optimizers when used in data scarce conditions where, in addition to convergence speed, it also significantly improves model generalization, managing to train a network with a single fully connected hidden layer using only 1% of the MNIST dataset to reach 97.79% test accuracy. In an even more extreme scenario, it manages to reach 97.44% test accuracy using only 10 samples per class. These results represent a relative error rate reduction of 81.78% and 88.07% respectively, compared to the standard optimizers, Stochastic Gradient Descent (SGD) and Adam.
updated: Mon Aug 01 2022 12:52:09 GMT+0000 (UTC)
published: Mon Aug 01 2022 12:52:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト