ニューラルネットワークアーキテクチャの設計は、試行錯誤と経験的フィードバックを使用した人間の専門知識に基づいているか、個別の個別のアーキテクチャの選択で実行される大規模な強化学習戦略に取り組むことがよくあります。後者の場合、最適化は微分不可能であることが多く、また、微分のない最適化手法をあまり受け入れられません。現在使用されているほとんどのメソッドには、かなりの計算リソースが必要です。また、リソースの制約をさらに満たすネットワークが必要な場合は、検索でリソースの特定の予算制約と精度のバランスを取る必要があるため、上記の課題は悪化します。この問題は集合関数の最適化として定式化されます-この集合関数の経験的挙動はしばしば(常にではないが)限界利得と単調性の原理を満たしていることがわかります-劣モジュラ性の概念の中心的な特性。この観察に基づいて、離散最適化内のアルゴリズムを適応させて、ニューラルネットワークアーキテクチャ検索のヒューリスティックスキームを取得します。ここでは、アーキテクチャにリソースの制約があります。この単純なスキームをCIFAR-100およびImageNetに適用すると、リソースに制約のあるアーキテクチャが、モバイルデバイス向けに設計された最新のモデルよりも定量的に優れたパフォーマンスで識別されます。具体的には、より高速な検索方法で、より少ないパラメーターと計算で高性能なアーキテクチャを見つけます。
The design of neural network architectures is frequently either based on human expertise using trial/error and empirical feedback or tackled via large scale reinforcement learning strategies performed over distinct discrete architecture choices. In the latter case, the optimization is often non-differentiable and also not very amenable to derivative-free optimization methods. Most methods in use today require sizable computational resources. And if we want networks that additionally satisfy resource constraints, the above challenges are exacerbated because the search must now balance accuracy with certain budget constraints on resources. We formulate this problem as the optimization of a set function -- we find that the empirical behavior of this set function often (but not always) satisfies marginal gain and monotonicity principles -- properties central to the idea of submodularity. Based on this observation, we adapt algorithms within discrete optimization to obtain heuristic schemes for neural network architecture search, where we have resource constraints on the architecture. This simple scheme when applied on CIFAR-100 and ImageNet, identifies resource-constrained architectures with quantifiably better performance than current state-of-the-art models designed for mobile devices. Specifically, we find high-performing architectures with fewer parameters and computations by a search method that is much faster.