arXiv reaDer
GPT-NAS: 生成事前トレーニング モデルを使用した進化的なニューラル アーキテクチャの検索
GPT-NAS: Evolutionary Neural Architecture Search with the Generative Pre-Trained Model
Neural Architecture Search (NAS) は、最適なニューラル ネットワーク アーキテクチャを自動的に設計する効果的な方法の 1 つとして登場しました。ニューラル アーキテクチャはいくつかのタスクで人間レベルのパフォーマンスを達成していますが、NAS 手法から得られるものはほとんどありません。主な理由は、ニューラル アーキテクチャの検索スペースが膨大であり、NAS アルゴリズムの効率が低下していることです。この研究では、検索戦略として進化的アルゴリズム (EA) を使用した生成事前トレーニング (GPT) モデルによってニューラル アーキテクチャを最適化する、GPT-NAS と呼ばれる新しいアーキテクチャ検索アルゴリズムを紹介します。 GPT-NAS では、大規模なコーパスで事前トレーニングされた生成モデルがニューラル アーキテクチャを構築する基本法則を学習できると想定しています。したがって、GPT-NAS は GPT モデルを活用して、基本的なコンポーネントを考慮して合理的なアーキテクチャ コンポーネントを提案し、EA を利用して最適なソリューションを検索します。このようなアプローチでは、検索プロセスに事前知識を導入することで、検索スペースを大幅に削減できます。広範な実験結果により、当社の GPT-NAS メソッドは、手動で設計された 7 つのニューラル アーキテクチャおよび競合する NAS メソッドによって提供される 13 のアーキテクチャよりも大幅に優れていることが示されています。さらに、私たちの実験では、提案されたアルゴリズムが、GPTを使用しない場合と比較して、細かく調整されたニューラルアーキテクチャのパフォーマンスを最大約12%向上させることも示しており、ニューラルアーキテクチャの検索におけるその有効性をさらに実証しています。
Neural Architecture Search (NAS) has emerged as one of the effective methods to design the optimal neural network architecture automatically. Although neural architectures have achieved human-level performances in several tasks, few of them are obtained from the NAS method. The main reason is the huge search space of neural architectures, making NAS algorithms inefficient. This work presents a novel architecture search algorithm, called GPT-NAS, that optimizes neural architectures by Generative Pre-Trained (GPT) model with an evolutionary algorithm (EA) as the search strategy. In GPT-NAS, we assume that a generative model pre-trained on a large-scale corpus could learn the fundamental law of building neural architectures. Therefore, GPT-NAS leverages the GPT model to propose reasonable architecture components given the basic one and then utilizes EAs to search for the optimal solution. Such an approach can largely reduce the search space by introducing prior knowledge in the search process. Extensive experimental results show that our GPT-NAS method significantly outperforms seven manually designed neural architectures and thirteen architectures provided by competing NAS methods. In addition, our experiments also indicate that the proposed algorithm improves the performance of finely tuned neural architectures by up to about 12% compared to those without GPT, further demonstrating its effectiveness in searching neural architectures.
updated: Sun May 28 2023 07:56:46 GMT+0000 (UTC)
published: Tue May 09 2023 11:29:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト