arXiv reaDer
相互認識サブグラフ微分可能アーキテクチャ検索
Mutually-aware Sub-Graphs Differentiable Architecture Search
NASの分野では、マルチパスアルゴリズムとシングルパスメソッドの2つのパラダイムが主流であるシンプルさと効率性から、差別化可能なアーキテクチャ検索が普及しています。マルチパスフレームワーク(DARTSなど)は直感的ですが、メモリ使用量とトレーニングの崩壊に悩まされています。シングルパス方式(egGDASおよびProxylessNAS)は、メモリの問題を軽減し、検索と評価の間のギャップを縮小しますが、パフォーマンスを犠牲にします。この論文では、相互認識サブグラフ微分可能アーキテクチャ検索(MSG-DAS)と呼ばれる、これら2つのパラダイムを橋渡しするための概念的にシンプルで効率的な方法を提案します。私たちのフレームワークの中核は、相互に排他的な複数のシングルパスサブグラフを生成する微分可能なGumbel-TopKサンプラーです。複数のサブグラフ設定によって引き起こされるより深刻なスキップ接続の問題を軽減するために、最適化を安定させるためのDropblock-Identityモジュールを提案します。利用可能なモデル(スーパーネットとサブグラフ)を最大限に活用するために、メモリ効率の高いスーパーネットガイダンス蒸留を導入してトレーニングを改善します。提案されたフレームワークは、柔軟なメモリ使用量と検索品質のバランスを取ります。 ImageNetとCIFAR10でのメソッドの有効性を示します。ここでは、検索されたモデルが最新のアプローチと同等のパフォーマンスを示しています。
Differentiable architecture search is prevalent in the field of NAS because of its simplicity and efficiency, where two paradigms, multi-path algorithms and single-path methods, are dominated. Multi-path framework (e.g. DARTS) is intuitive but suffers from memory usage and training collapse. Single-path methods (e.g.GDAS and ProxylessNAS) mitigate the memory issue and shrink the gap between searching and evaluation but sacrifice the performance. In this paper, we propose a conceptually simple yet efficient method to bridge these two paradigms, referred as Mutually-aware Sub-Graphs Differentiable Architecture Search (MSG-DAS). The core of our framework is a differentiable Gumbel-TopK sampler that produces multiple mutually exclusive single-path sub-graphs. To alleviate the severer skip-connect issue brought by multiple sub-graphs setting, we propose a Dropblock-Identity module to stabilize the optimization. To make best use of the available models (super-net and sub-graphs), we introduce a memory-efficient super-net guidance distillation to improve training. The proposed framework strikes a balance between flexible memory usage and searching quality. We demonstrate the effectiveness of our methods on ImageNet and CIFAR10, where the searched models show a comparable performance as the most recent approaches.
updated: Mon Jul 12 2021 09:46:24 GMT+0000 (UTC)
published: Fri Jul 09 2021 09:31:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト