arXiv reaDer
ErfAct:非単調で滑らかなトレーニング可能な活性化関数
ErfAct: Non-monotonic smooth trainable Activation Functions
活性化関数は、ネットワークに非線形性を導入するニューラルネットワークの重要なコンポーネントです。ニューラルネットワークの最先端のパフォーマンスは、活性化関数の完璧な選択に依存します。 ErfAct-1とErfAct-2と呼ばれる2つの新しい非単調で滑らかな訓練可能な活性化関数を提案します。実験によると、提案された関数は、ReLU、Swish、Mishなどの広く使用されているアクティベーションと比較してネットワークパフォーマンスを大幅に向上させます。 ReLUをErfAct-1およびErfAct-2に置き換えると、CIFAR100データセットのPreactResNet-34ネットワークのトップ1精度が5.21%および5.04%向上し、PreactResNet-34ネットワークのトップ1精度が2.58%および2.76%向上します。 CIFAR10データセット、Pascal VOCデータセットのSSD300モデルの平均平均精度(mAP)が1.0%および1.0%向上。
An activation function is a crucial component of a neural network that introduces non-linearity in the network. The state-of-the-art performance of a neural network depends on the perfect choice of an activation function. We propose two novel non-monotonic smooth trainable activation functions, called ErfAct-1 and ErfAct-2. Experiments suggest that the proposed functions improve the network performance significantly compared to the widely used activations like ReLU, Swish, and Mish. Replacing ReLU by ErfAct-1 and ErfAct-2, we have 5.21% and 5.04% improvement for top-1 accuracy on PreactResNet-34 network in CIFAR100 dataset, 2.58% and 2.76% improvement for top-1 accuracy on PreactResNet-34 network in CIFAR10 dataset, 1.0%, and 1.0% improvement on mean average precision (mAP) on SSD300 model in Pascal VOC dataset.
updated: Thu Sep 09 2021 16:17:38 GMT+0000 (UTC)
published: Thu Sep 09 2021 16:17:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト