arXiv reaDer
Shapley-NAS:ニューラルアーキテクチャ検索の運用貢献の発見
Shapley-NAS: Discovering Operation Contribution for Neural Architecture Search
本論文では、神経構造探索のための操作寄与(Shapley-NAS)を評価するためのシャープレイ値ベースの方法を提案した。微分可能アーキテクチャ検索(DARTS)は、最急降下法でアーキテクチャパラメータを最適化することにより、最適なアーキテクチャを取得します。これにより、検索コストが大幅に削減されます。ただし、勾配降下法によって更新されたアーキテクチャパラメータの大きさは、タスクパフォーマンスに対する実際の操作の重要性を明らかにすることができず、したがって、取得したアーキテクチャの有効性を損ないます。対照的に、検証の精度に対する操作の直接的な影響を評価することを提案します。スーパーネットコンポーネント間の複雑な関係に対処するために、シャープレイ値を活用して、考えられるすべての組み合わせを考慮して、それらのわずかな寄与を定量化します。具体的には、スーパーネットの重みを繰り返し最適化し、シャープレイ値を介して操作の寄与を評価することでアーキテクチャパラメータを更新します。これにより、タスクに大きく寄与する操作を選択することで最適なアーキテクチャが導き出されます。シャープレイ値の正確な計算はNP困難であるため、効率的な近似のために早期切り捨てを使用したモンテカルロサンプリングベースのアルゴリズムが採用され、サンプリングプロセスの変動を緩和するために運動量更新メカニズムが採用されています。さまざまなデータセットとさまざまな検索スペースでの広範な実験により、Shapley-NASは、検索コストを抑えながら、最先端の方法よりもかなり優れていることがわかりました。コードはhttps://github.com/Euphoria16/Shapley-NAS.gitで入手できます。
In this paper, we propose a Shapley value based method to evaluate operation contribution (Shapley-NAS) for neural architecture search. Differentiable architecture search (DARTS) acquires the optimal architectures by optimizing the architecture parameters with gradient descent, which significantly reduces the search cost. However, the magnitude of architecture parameters updated by gradient descent fails to reveal the actual operation importance to the task performance and therefore harms the effectiveness of obtained architectures. By contrast, we propose to evaluate the direct influence of operations on validation accuracy. To deal with the complex relationships between supernet components, we leverage Shapley value to quantify their marginal contributions by considering all possible combinations. Specifically, we iteratively optimize the supernet weights and update the architecture parameters by evaluating operation contributions via Shapley value, so that the optimal architectures are derived by selecting the operations that contribute significantly to the tasks. Since the exact computation of Shapley value is NP-hard, the Monte-Carlo sampling based algorithm with early truncation is employed for efficient approximation, and the momentum update mechanism is adopted to alleviate fluctuation of the sampling process. Extensive experiments on various datasets and various search spaces show that our Shapley-NAS outperforms the state-of-the-art methods by a considerable margin with light search cost. The code is available at https://github.com/Euphoria16/Shapley-NAS.git
updated: Mon Jun 20 2022 14:41:49 GMT+0000 (UTC)
published: Mon Jun 20 2022 14:41:49 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト