arXiv reaDer
セルベースのニューラルアーキテクチャ検索で学習したアーキテクチャを理解する
Understanding Architectures Learnt by Cell-based Neural Architecture Search
 ニューラルアーキテクチャ検索(NAS)は、特定のタスク(画像分類や言語モデリングなど)についてアーキテクチャを自動的に検索します。検索の効率と有効性の改善は、近年注目を集めています。ただし、生成されたアーキテクチャを理解するための努力はほとんど行われていません。このホワイトペーパーでは、既存のNASアルゴリズム(DARTS、ENASなど)が広くて浅いセル構造を持つアーキテクチャを優先する傾向があることを最初に明らかにします。これらの好ましいアーキテクチャは一貫して高速な収束を実現し、その結果、NASアルゴリズムによって選択されます。私たちの経験的および理論的研究は、それらの高速収束が滑らかな損失景観と正確な勾配情報に由来することをさらに確認します。それにもかかわらず、これらのアーキテクチャーは、同じ検索スペース内の他の候補アーキテクチャーと比較して、必ずしもより優れた一般化パフォーマンスをもたらすとは限らないため、既存のNASアルゴリズムを改訂することにより、さらなる改善が可能です。
Neural architecture search (NAS) searches architectures automatically for given tasks, e.g., image classification and language modeling. Improving the search efficiency and effectiveness have attracted increasing attention in recent years. However, few efforts have been devoted to understanding the generated architectures. In this paper, we first reveal that existing NAS algorithms (e.g., DARTS, ENAS) tend to favor architectures with wide and shallow cell structures. These favorable architectures consistently achieve fast convergence and are consequently selected by NAS algorithms. Our empirical and theoretical study further confirms that their fast convergence derives from their smooth loss landscape and accurate gradient information. Nonetheless, these architectures may not necessarily lead to better generalization performance compared with other candidate architectures in the same search space, and therefore further improvement is possible by revising existing NAS algorithms.
updated: Wed Jan 01 2020 13:57:23 GMT+0000 (UTC)
published: Fri Sep 20 2019 15:49:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト