AceNAS: Learning to Rank Ace Neural Architectures with Weak Supervision of Weight Sharing
アーキテクチャパフォーマンス予測子は、ニューラルアーキテクチャ検索(NAS)で広く使用されています。それらは単純で効果的であることが示されていますが、以前の技術の最適化の目的(たとえば、正確な精度の推定または空間内のすべてのアーキテクチャの完全なランク付け)は、NASのランク付けの性質を捉えていませんでした。さらに、信頼性の高い予測子を構築するには、通常、多数のグラウンドトゥルースアーキテクチャと精度のペアが必要であり、プロセスの計算コストが高くなりすぎます。これらを克服するために、このホワイトペーパーでは、NASを新しい観点から見て、空間から最適な(エース)アーキテクチャを選択するためのLearning to Rank(LTR)メソッドを紹介します。具体的には、正規化された割引累積ゲイン(NDCG)をターゲットメトリックとして使用し、LambdaRankをトレーニングアルゴリズムとして使用することを提案します。また、スーパーネットから取得した弱いラベルでアーキテクチャ表現を事前トレーニングし、最初からトレーニングした少数のアーキテクチャを使用してランキングモデルを微調整することにより、重み共有からの弱い監視を活用することを提案します。 NASベンチマークと大規模な検索スペースに関する広範な実験は、私たちのアプローチが大幅に削減された検索コストでSOTAよりも優れていることを示しています。
Architecture performance predictors have been widely used in neural architecture search (NAS). Although they are shown to be simple and effective, the optimization objectives in previous arts (e.g., precise accuracy estimation or perfect ranking of all architectures in the space) did not capture the ranking nature of NAS. In addition, a large number of ground-truth architecture-accuracy pairs are usually required to build a reliable predictor, making the process too computationally expensive. To overcome these, in this paper, we look at NAS from a novel point of view and introduce Learning to Rank (LTR) methods to select the best (ace) architectures from a space. Specifically, we propose to use Normalized Discounted Cumulative Gain (NDCG) as the target metric and LambdaRank as the training algorithm. We also propose to leverage weak supervision from weight sharing by pretraining architecture representation on weak labels obtained from the super-net and then finetuning the ranking model using a small number of architectures trained from scratch. Extensive experiments on NAS benchmarks and large-scale search spaces demonstrate that our approach outperforms SOTA with a significantly reduced search cost.
updated: Fri Aug 06 2021 08:31:42 GMT+0000 (UTC)
published: Fri Aug 06 2021 08:31:42 GMT+0000 (UTC)
