arXiv reaDer
アクティベートするかどうか:カスタマイズされたアクティベーションの学習
Activate or Not: Learning Customized Activation
ニューロンを活性化するかどうかを学習する、ACONと呼ばれる単純で効果的で一般的な活性化関数を紹介します。興味深いことに、最近人気のあるNAS検索のアクティベーションであるSwishは、ReLUの滑らかな近似として解釈できることがわかりました。直感的には、同じように、より一般的なMaxoutファミリを新しいACONファミリに近似します。これにより、パフォーマンスが大幅に向上し、SwishがACONの特殊なケースになります。次に、メタACONを紹介します。これは、非線形(アクティブ化)と線形(非アクティブ化)の間のパラメーター切り替えを最適化することを明示的に学習し、新しいデザインスペースを提供します。活性化関数を変更するだけで、小さなモデルと高度に最適化された大きなモデルの両方でその有効性を示します(たとえば、MobileNet-0.25とResNet-152でImageNetトップ1の精度がそれぞれ6.7%と1.8%向上します)。さらに、私たちの新しいACONは、オブジェクト検出とセマンティックセグメンテーションに自然に移行でき、ACONがさまざまなタスクで効果的な代替手段であることを示しています。コードはhttps://github.com/nmaac/aconで入手できます。
We present a simple, effective, and general activation function we term ACON which learns to activate the neurons or not. Interestingly, we find Swish, the recent popular NAS-searched activation, can be interpreted as a smooth approximation to ReLU. Intuitively, in the same way, we approximate the more general Maxout family to our novel ACON family, which remarkably improves the performance and makes Swish a special case of ACON. Next, we present meta-ACON, which explicitly learns to optimize the parameter switching between non-linear (activate) and linear (inactivate) and provides a new design space. By simply changing the activation function, we show its effectiveness on both small models and highly optimized large models (e.g. it improves the ImageNet top-1 accuracy rate by 6.7% and 1.8% on MobileNet-0.25 and ResNet-152, respectively). Moreover, our novel ACON can be naturally transferred to object detection and semantic segmentation, showing that ACON is an effective alternative in a variety of tasks. Code is available at https://github.com/nmaac/acon.
updated: Fri Apr 16 2021 09:56:15 GMT+0000 (UTC)
published: Thu Sep 10 2020 09:59:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト