arXiv reaDer
CLOSE:より良いワンショットNASに向けた共有範囲に関するカリキュラム学習
CLOSE: Curriculum Learning On the Sharing Extent Towards Better One-shot NAS
ワンショットニューラルアーキテクチャ検索(NAS)は、その効率性からアーキテクチャの発見に広く使用されています。ただし、以前の調査では、アーキテクチャ間の操作パラメータの過度の共有(つまり、共有範囲が大きい)のために、アーキテクチャのワンショットパフォーマンス見積もりがスタンドアロントレーニングでのパフォーマンスと十分に相関していない可能性があることが明らかになっています。したがって、最近の方法では、共有範囲を減らすために、さらに多くのパラメータ化されたスーパーネットが構築されています。しかし、これらの改善された方法は、多数の追加パラメーターを導入するため、トレーニングコストとランキング品質の間に望ましくないトレードオフを引き起こします。上記の問題を軽減するために、共有範囲に関するカリキュラム学習(CLOSE)を適用して、スーパーネットを効率的かつ効果的にトレーニングすることを提案します。具体的には、最初は共有範囲が大きい(カリキュラムが簡単な)スーパーネットをトレーニングし、徐々に共有範囲が狭くなる(カリキュラムが難しい)スーパーネットをトレーニングします。このトレーニング戦略をサポートするために、パラメーターを操作から切り離して柔軟な共有スキームと調整可能な共有範囲を実現する新しいスーパーネット(CLOSENet)を設計します。広範な実験により、CLOSEは、他のワンショットスーパーネットよりも、さまざまな計算予算の制約にわたって優れたランキング品質を取得でき、さまざまな検索戦略と組み合わせると、優れたアーキテクチャを発見できることが実証されています。コードはhttps://github.com/walkerning/aw_nasで入手できます。
One-shot Neural Architecture Search (NAS) has been widely used to discover architectures due to its efficiency. However, previous studies reveal that one-shot performance estimations of architectures might not be well correlated with their performances in stand-alone training because of the excessive sharing of operation parameters (i.e., large sharing extent) between architectures. Thus, recent methods construct even more over-parameterized supernets to reduce the sharing extent. But these improved methods introduce a large number of extra parameters and thus cause an undesirable trade-off between the training costs and the ranking quality. To alleviate the above issues, we propose to apply Curriculum Learning On Sharing Extent (CLOSE) to train the supernet both efficiently and effectively. Specifically, we train the supernet with a large sharing extent (an easier curriculum) at the beginning and gradually decrease the sharing extent of the supernet (a harder curriculum). To support this training strategy, we design a novel supernet (CLOSENet) that decouples the parameters from operations to realize a flexible sharing scheme and adjustable sharing extent. Extensive experiments demonstrate that CLOSE can obtain a better ranking quality across different computational budget constraints than other one-shot supernets, and is able to discover superior architectures when combined with various search strategies. Code is available at https://github.com/walkerning/aw_nas.
updated: Sat Jul 16 2022 07:45:17 GMT+0000 (UTC)
published: Sat Jul 16 2022 07:45:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト