Rectified Linear Unitは現在、深い畳み込みニューラルネットワークにおける最先端の活性化関数です。 ReLUの死にかけているニューロンの問題に対処するために、トレーニング可能な係数を持つ正弦関数をReLUに追加するパラメトリック変分線形ユニット(PVLU)を提案します。実領域全体に非線形性と非ゼロ勾配を導入することに加えて、PVLUは、伝達学習のコンテキストで実装されると、微調整のメカニズムとして機能します。単純な非転送シーケンシャルCNNでは、PVLU置換により、CIFAR-100で16.3%および11.3%(データ拡張の有無にかかわらず)の相対誤差の減少が可能になりました。 PVLUは、転移学習モデルでもテストされています。 VGG-16モデルとVGG-19モデルでは、ReLUをPVLUに置き換えた後、CIFAR-10でそれぞれ9.5%と10.7%の相対誤差が減少します。ガウスフィルター処理されたCIFAR-10画像でトレーニングすると、VGGモデルでも同様の改善が見られます。最も注目すべきは、PVLUを使用した微調整により、CIFARデータセットの最先端に近い残差ニューラルネットワークアーキテクチャの相対誤差を最大10%以上削減できることです。
The Rectified Linear Unit is currently a state-of-the-art activation function in deep convolutional neural networks. To combat ReLU's dying neuron problem, we propose the Parametric Variational Linear Unit (PVLU), which adds a sinusoidal function with trainable coefficients to ReLU. Along with introducing nonlinearity and non-zero gradients across the entire real domain, PVLU acts as a mechanism of fine-tuning when implemented in the context of transfer learning. On a simple, non-transfer sequential CNN, PVLU substitution allowed for relative error decreases of 16.3% and 11.3% (without and with data augmentation) on CIFAR-100. PVLU is also tested on transfer learning models. The VGG-16 and VGG-19 models experience relative error reductions of 9.5% and 10.7% on CIFAR-10, respectively, after the substitution of ReLU with PVLU. When training on Gaussian-filtered CIFAR-10 images, similar improvements are noted for the VGG models. Most notably, fine-tuning using PVLU allows for relative error reductions up to and exceeding 10% for near state-of-the-art residual neural network architectures on the CIFAR datasets.