Neural Architecture Search with Reinforcement Learning
ニューラルネットワークは、画像、音声、自然言語理解における多くの困難な学習タスクに有効に働く強力で柔軟なモデルである。その成功にもかかわらず、ニューラルネットワークはまだ設計が難しい。本論文では、ニューラルネットワークのモデル記述を生成するためにリカレントネットワークを使用し、このRNNを強化学習で訓練して、検証セット上で生成されたアーキテクチャの期待される精度を最大化する。CIFAR-10データセットにおいて、我々の手法は、ゼロから始めることで、テストセットの精度の点で、人間が発明した最高のアーキテクチャに匹敵する新しいネットワークアーキテクチャを設計することができる。我々のCIFAR-10モデルはテストエラー率3.65を達成しており、これは類似のアーキテクチャスキームを使用した以前の最先端モデルよりも0.09%向上し、1.05倍速くなっている。Penn Treebankデータセットでは、我々のモデルは、広く使われているLSTMセルやその他の最先端のベースラインを上回る新しいリカレントセルを構成することができる。我々のセルは、Penn Treebankのテストセットのパープレキシティ62.4を達成しており、これは以前の最先端モデルよりもパープレキシティが3.6向上している。このセルは、PTB上の文字言語モデリングタスクにも移植でき、1.214の最新のパープレキシティを達成した。
Neural networks are powerful and flexible models that work well for many difficult learning tasks in image, speech and natural language understanding. Despite their success, neural networks are still hard to design. In this paper, we use a recurrent network to generate the model descriptions of neural networks and train this RNN with reinforcement learning to maximize the expected accuracy of the generated architectures on a validation set. On the CIFAR-10 dataset, our method, starting from scratch, can design a novel network architecture that rivals the best human-invented architecture in terms of test set accuracy. Our CIFAR-10 model achieves a test error rate of 3.65, which is 0.09 percent better and 1.05x faster than the previous state-of-the-art model that used a similar architectural scheme. On the Penn Treebank dataset, our model can compose a novel recurrent cell that outperforms the widely-used LSTM cell, and other state-of-the-art baselines. Our cell achieves a test set perplexity of 62.4 on the Penn Treebank, which is 3.6 perplexity better than the previous state-of-the-art model. The cell can also be transferred to the character language modeling task on PTB and achieves a state-of-the-art perplexity of 1.214.
updated: Wed Feb 15 2017 05:28:05 GMT+0000 (UTC)
published: Sat Nov 05 2016 00:41:37 GMT+0000 (UTC)
