Neural Architecture Search(NAS)の重要なステップの1つは、候補となるアーキテクチャのパフォーマンスを見積もることです。既存の方法は、検証パフォーマンスを直接使用するか、パフォーマンスを推定するための予測子を学習します。ただし、これらの方法は、計算コストが高くなるか、非常に不正確になる可能性があり、検索の効率とパフォーマンスに深刻な影響を与える可能性があります。さらに、特定のタスクで正確なパフォーマンスでアーキテクチャに注釈を付けることは非常に難しいため、ラベル付けされたデータがないため、有望なパフォーマンス予測子を学習することは簡単ではありません。このホワイトペーパーでは、NASの絶対的なパフォーマンスを見積もる必要はないかもしれないと主張します。それどころか、アーキテクチャがベースラインアーキテクチャよりも優れているかどうかを理解するだけでよい場合があります。ただし、この比較情報を報酬として活用する方法と、限定されたラベル付きデータを適切に使用する方法は、依然として2つの大きな課題です。本論文では、アーキテクチャ間の比較結果を報酬として、アーキテクチャ検索を実行する新しい対照神経アーキテクチャ検索(CTNAS)手法を提案します。具体的には、候補アーキテクチャがベースラインアーキテクチャよりも優れている確率を計算するために、ニューラルアーキテクチャコンパレータ(NAC)を設計および学習します。さらに、カリキュラム学習方法でベースラインを繰り返し改善するためのベースライン更新スキームを提示します。さらに重要なことに、NACの学習は、アーキテクチャ全体のランキングを最適化することと同等であることを理論的に示しています。 3つの検索スペースでの広範な実験は、既存の方法に対するCTNASの優位性を示しています。
One of the key steps in Neural Architecture Search (NAS) is to estimate the performance of candidate architectures. Existing methods either directly use the validation performance or learn a predictor to estimate the performance. However, these methods can be either computationally expensive or very inaccurate, which may severely affect the search efficiency and performance. Moreover, as it is very difficult to annotate architectures with accurate performance on specific tasks, learning a promising performance predictor is often non-trivial due to the lack of labeled data. In this paper, we argue that it may not be necessary to estimate the absolute performance for NAS. On the contrary, we may need only to understand whether an architecture is better than a baseline one. However, how to exploit this comparison information as the reward and how to well use the limited labeled data remains two great challenges. In this paper, we propose a novel Contrastive Neural Architecture Search (CTNAS) method which performs architecture search by taking the comparison results between architectures as the reward. Specifically, we design and learn a Neural Architecture Comparator (NAC) to compute the probability of candidate architectures being better than a baseline one. Moreover, we present a baseline updating scheme to improve the baseline iteratively in a curriculum learning manner. More critically, we theoretically show that learning NAC is equivalent to optimizing the ranking over architectures. Extensive experiments in three search spaces demonstrate the superiority of our CTNAS over existing methods.