arXiv reaDer
区分的線形ユニットを使用した特殊な活性化関数の学習
Learning specialized activation functions with the Piecewise Linear Unit
活性化関数の選択は、現代のディープニューラルネットワークにとって非常に重要です。 Rectified Linear Unit(ReLU)やそのバリアントなど、人気のある手動で設計された活性化関数は、さまざまなタスクやモデルで有望なパフォーマンスを示します。自動的に検出される活性化関数であるSwishが提案されており、多くの困難なデータセットでReLUよりも優れています。ただし、2つの主な欠点があります。まず、ツリーベースの検索スペースは非常に離散的で制限されているため、検索が困難です。第二に、サンプルベースの検索方法は非効率的であり、各データセットまたはニューラルアーキテクチャに特化した活性化関数を見つけることが不可能になります。これらの欠点に対処するために、慎重に設計された定式化と学習方法を組み込んだ区分的線形単位(PWLU)と呼ばれる新しい活性化関数を提案します。特殊な活性化関数を学習し、ImageNetやCOCOなどの大規模なデータセットでSOTAパフォーマンスを実現します。たとえば、ImageNet分類データセットでは、PWLUはResNet-18 / ResNet-50 / MobileNet-V2 / MobileNet-V3 / EfficiencyNet-B0のSwishよりも0.9%/ 0.53%/ 1.0%/ 1.7%/ 1.0%トップ1の精度を向上させます。 PWLUは、実装が簡単で、推論が効率的であり、実際のアプリケーションに広く適用できます。
The choice of activation functions is crucial for modern deep neural networks. Popular hand-designed activation functions like Rectified Linear Unit(ReLU) and its variants show promising performance in various tasks and models. Swish, the automatically discovered activation function, has been proposed and outperforms ReLU on many challenging datasets. However, it has two main drawbacks. First, the tree-based search space is highly discrete and restricted, which is difficult for searching. Second, the sample-based searching method is inefficient, making it infeasible to find specialized activation functions for each dataset or neural architecture. To tackle these drawbacks, we propose a new activation function called Piecewise Linear Unit(PWLU), which incorporates a carefully designed formulation and learning method. It can learn specialized activation functions and achieves SOTA performance on large-scale datasets like ImageNet and COCO. For example, on ImageNet classification dataset, PWLU improves 0.9%/0.53%/1.0%/1.7%/1.0% top-1 accuracy over Swish for ResNet-18/ResNet-50/MobileNet-V2/MobileNet-V3/EfficientNet-B0. PWLU is also easy to implement and efficient at inference, which can be widely applied in real-world applications.
updated: Thu Apr 08 2021 11:29:11 GMT+0000 (UTC)
published: Thu Apr 08 2021 11:29:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト