arXiv reaDer
振動活性化関数を使用した CNN の評価
Evaluating CNN with Oscillatory Activation Function
画像から高次元の複雑な特徴を学習する CNN の機能の背後にある理由は、活性化関数によって導入される非線形性です。活性化関数の選択はモデリングの重要なステップであるため、ニューラル ネットワークのトレーニング プロセスを改善するために、いくつかの高度な活性化関数が発見されています。最近の研究では、振動活性化関数を使用して、人間の大脳皮質に着想を得た分類問題を解決することが提案されています。このホワイト ペーパーでは、振動活性化関数 (GCU) と、ReLu、PReLu、Mish などの他の一般的に使用される活性化関数を使用して、MNIST および CIFAR10 データセットでの CNN アーキテクチャ ALexNet の 1 つのパフォーマンスを調査します。
The reason behind CNNs capability to learn high-dimensional complex features from the images is the non-linearity introduced by the activation function. Several advanced activation functions have been discovered to improve the training process of neural networks, as choosing an activation function is a crucial step in the modeling. Recent research has proposed using an oscillating activation function to solve classification problems inspired by the human brain cortex. This paper explores the performance of one of the CNN architecture ALexNet on MNIST and CIFAR10 datasets using oscillatory activation function (GCU) and some other commonly used activation functions like ReLu, PReLu, and Mish.
updated: Sun Nov 13 2022 11:17:13 GMT+0000 (UTC)
published: Sun Nov 13 2022 11:17:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト