arXiv reaDer
ニューラルネットワークプルーニングによるハイパーパラメータの最適化
Hyperparameter Optimization with Neural Network Pruning
深層学習モデルはハイパーパラメーターに大きく依存しているため、長時間かかる場合でも、深層学習モデルベースのアプリケーションを開発するにはハイパーパラメーターの最適化が不可欠です。深層学習モデルを使用したサービス開発が徐々に競争力を増しているため、多くの開発者は迅速なハイパーパラメータ最適化アルゴリズムを強く求めています。より高速なハイパーパラメータ最適化アルゴリズムのニーズに対応するために、研究者はハイパーパラメータ最適化アルゴリズムの速度の向上に焦点を合わせています。ただし、深層学習モデル自体の計算コストが高いためにハイパーパラメータ最適化にかかる膨大な時間は、詳細には扱われていません。ベイズ最適化で代理モデルを使用するのと同様に、この問題を解決するには、ハイパーパラメーター最適化に使用されるニューラルネットワーク(N_B)のプロキシモデルを検討する必要があります。ニューラルネットワークの剪定の主な目標、つまり高い計算コストの削減とパフォーマンスの維持に触発されて、ニューラルネットワークの剪定によって得られたニューラルネットワーク(N_P)はN_Bの優れたプロキシモデルであると推測しました。私たちのアイデアを検証するために、CIFAR10、CFIAR100、TinyImageNetデータセット、3つの一般的に使用されるニューラルネットワーク、および3つの代表的なハイパーパラメーター最適化手法を使用して広範な実験を行いました。これらの実験を通じて、N_Pが迅速なハイパーパラメータ最適化のためのN_Bの優れたプロキシモデルになり得ることを確認しました。提案されたハイパーパラメータ最適化フレームワークは、時間を最大37%短縮できます。
Since the deep learning model is highly dependent on hyperparameters, hyperparameter optimization is essential in developing deep learning model-based applications, even if it takes a long time. As service development using deep learning models has gradually become competitive, many developers highly demand rapid hyperparameter optimization algorithms. In order to keep pace with the needs of faster hyperparameter optimization algorithms, researchers are focusing on improving the speed of hyperparameter optimization algorithm. However, the huge time consumption of hyperparameter optimization due to the high computational cost of the deep learning model itself has not been dealt with in-depth. Like using surrogate model in Bayesian optimization, to solve this problem, it is necessary to consider proxy model for a neural network (N_B) to be used for hyperparameter optimization. Inspired by the main goal of neural network pruning, i.e., high computational cost reduction and performance preservation, we presumed that the neural network (N_P) obtained through neural network pruning would be a good proxy model of N_B. In order to verify our idea, we performed extensive experiments by using CIFAR10, CFIAR100, and TinyImageNet datasets and three generally-used neural networks and three representative hyperparameter optmization methods. Through these experiments, we verified that N_P can be a good proxy model of N_B for rapid hyperparameter optimization. The proposed hyperparameter optimization framework can reduce the amount of time up to 37%.
updated: Wed May 18 2022 02:51:47 GMT+0000 (UTC)
published: Wed May 18 2022 02:51:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト