arXiv reaDer
均一なサンプリングによる単一パスのワンショットニューラルアーキテクチャ検索
Single Path One-Shot Neural Architecture Search with Uniform Sampling
ワンショットのニューラルアーキテクチャ検索(NAS)パラダイムを再検討し、既存のNASアプローチに対するその利点を分析します。ただし、既存のワンショットメソッドはトレーニングが難しく、ImageNetのような大規模なデータセットではまだ効果的ではありません。この作業では、トレーニングの課題に対処するためのシングルパスワンショットモデルを提案します。私たちの中心的なアイデアは、単純化されたスーパーネットを構築することです。このアーキテクチャでは、すべてのアーキテクチャが単一のパスであり、重みの共適応問題が軽減されます。トレーニングは、均一パスサンプリングによって実行されます。すべてのアーキテクチャ(およびそれらの重み)は、完全かつ均等にトレーニングされます。包括的な実験により、私たちのアプローチが柔軟で効果的であることが確認されています。トレーニングは簡単で、検索も高速です。複雑な検索スペース(ビルディングブロック、チャネル、混合精度の量子化など)やさまざまな検索制約(FLOP、レイテンシなど)を簡単にサポートします。様々なニーズに対応できるので便利です。大規模なデータセットImageNetで最先端のパフォーマンスを実現します。
We revisit the one-shot Neural Architecture Search (NAS) paradigm and analyze its advantages over existing NAS approaches. Existing one-shot method, however, is hard to train and not yet effective on large scale datasets like ImageNet. This work propose a Single Path One-Shot model to address the challenge in the training. Our central idea is to construct a simplified supernet, where all architectures are single paths so that weight co-adaption problem is alleviated. Training is performed by uniform path sampling. All architectures (and their weights) are trained fully and equally. Comprehensive experiments verify that our approach is flexible and effective. It is easy to train and fast to search. It effortlessly supports complex search spaces (e.g., building blocks, channel, mixed-precision quantization) and different search constraints (e.g., FLOPs, latency). It is thus convenient to use for various needs. It achieves start-of-the-art performance on the large dataset ImageNet.
updated: Wed Jul 08 2020 10:55:28 GMT+0000 (UTC)
published: Sun Mar 31 2019 14:34:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト