arXiv reaDer
S2DNAS:ニューラルアーキテクチャ検索による動的推論のための静的CNNモデルの変換
S2DNAS:Transforming Static CNN Model for Dynamic Inference via Neural Architecture Search
 最近、動的推論は、ディープコンボリューショナルニューラルネットワーク(CNN)の計算コストを削減する有望な方法として登場しました。静的な方法(ウェイトプルーニングなど)とは対照的に、動的推論は各入力サンプルに従って推論プロセスを適応的に調整します。これにより、モデル全体のパフォーマンスを維持しながら、「簡単な」サンプルの計算コストを大幅に削減できます。この記事では、一般的なフレームワークS2DNASを紹介します。これは、さまざまな静的CNNモデルを変換して、ニューラルアーキテクチャ検索による動的推論をサポートします。この目的のために、所定のCNNモデルに基づいて、最初にCNNアーキテクチャ空間を生成します。各アーキテクチャは、事前定義された変換を使用して特定のモデルから生成されたマルチステージCNNです。次に、生成された空間で最適なCNNアーキテクチャを自動的に検索する強化学習ベースのアプローチを提案します。最後に、検索されたマルチステージネットワークを使用して、各サンプルを評価するステージを適応的に選択することにより、動的推論を実行できます。推論に不規則な計算や複雑なコントローラーを導入したり、ゼロからCNNモデルを再設計したりする以前の作品とは異なり、この方法は一般的なCNNアーキテクチャのほとんどに一般化でき、検索された動的ネットワークはさまざまな既存の深層学習フレームワークを使用して直接展開できますハードウェアデバイス。
Recently, dynamic inference has emerged as a promising way to reduce the computational cost of deep convolutional neural network (CNN). In contrast to static methods (e.g. weight pruning), dynamic inference adaptively adjusts the inference process according to each input sample, which can considerably reduce the computational cost on "easy" samples while maintaining the overall model performance. In this paper, we introduce a general framework, S2DNAS, which can transform various static CNN models to support dynamic inference via neural architecture search. To this end, based on a given CNN model, we first generate a CNN architecture space in which each architecture is a multi-stage CNN generated from the given model using some predefined transformations. Then, we propose a reinforcement learning based approach to automatically search for the optimal CNN architecture in the generated space. At last, with the searched multi-stage network, we can perform dynamic inference by adaptively choosing a stage to evaluate for each sample. Unlike previous works that introduce irregular computations or complex controllers in the inference or re-design a CNN model from scratch, our method can generalize to most of the popular CNN architectures and the searched dynamic network can be directly deployed using existing deep learning frameworks in various hardware devices.
updated: Tue Dec 17 2019 02:54:18 GMT+0000 (UTC)
published: Sat Nov 16 2019 13:49:44 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト