微分可能アーキテクチャ検索(DARTS)は、その単純さと、継続的な緩和と結果の2レベル最適化問題の近似によって達成される小さな検索コストにより、多くの注目を集めています。ただし、DARTSは新しい問題に対してロバストに機能しません。DARTSがテストパフォーマンスが非常に低い縮退アーキテクチャを生成する広範な検索スペースを特定します。この障害モードを調査し、DARTSが検証損失を最小化する一方で、見つかったソリューションは、アーキテクチャ空間での高い検証損失曲率と一致する場合、一般化が不十分であることを示します。さまざまなタイプの正則化の1つを追加することにより、DARTSをロバスト化して、曲率が小さく一般化特性が優れたソリューションを見つけることができることを示します。これらの観察に基づいて、実際に大幅に堅牢に動作するDARTSのいくつかの簡単なバリエーションを提案します。私たちの観察は、3つの画像分類タスクの5つの検索スペースで堅牢であり、視差推定(高密度回帰タスク)と言語モデリングの非常に異なるドメインにも当てはまります。
Differentiable Architecture Search (DARTS) has attracted a lot of attention due to its simplicity and small search costs achieved by a continuous relaxation and an approximation of the resulting bi-level optimization problem. However, DARTS does not work robustly for new problems: we identify a wide range of search spaces for which DARTS yields degenerate architectures with very poor test performance. We study this failure mode and show that, while DARTS successfully minimizes validation loss, the found solutions generalize poorly when they coincide with high validation loss curvature in the architecture space. We show that by adding one of various types of regularization we can robustify DARTS to find solutions with less curvature and better generalization properties. Based on these observations, we propose several simple variations of DARTS that perform substantially more robustly in practice. Our observations are robust across five search spaces on three image classification tasks and also hold for the very different domains of disparity estimation (a dense regression task) and language modelling.