arXiv reaDer
運用ニューラルネットワーク
Operational Neural Networks
  フィードフォワード、完全に接続された人工ニューラルネットワーク(ANN)またはいわゆる多層パーセプトロン(MLP)は、よく知られた汎用近似器です。ただし、学習パフォーマンスは、近似しようとする関数またはソリューション空間によって大きく異なります。これは主に、線形ニューロンモデルのみに基づく同種の構成によるものです。したがって、彼らは単調で比較的単純で線形に分離可能な解空間の問題を非常によく学習しますが、解空間が非常に非線形で複雑な場合、完全に学習に失敗する可能性があります。同じ線形ニューロンモデルを2つの追加の制約(ローカル接続と重み共有)で共有することは、従来の畳み込みニューラルネットワーク(CNN)にも当てはまります。したがって、多くの困難な問題では、膨大な複雑さと深さにより、必要な多様性と学習パフォーマンスを実現できます。この欠点に対処し、畳み込みニューロンのより一般化されたモデルを実現するために、この研究では、操作ニューラルネットワーク(ONN)という新しいネットワークモデルを提案します。ネットワークの複雑さとトレーニングデータを最小限に抑えながら、非常に複雑でマルチモーダルな機能または空間を学習します。最後に、ONNの運用層を介してエラーを逆伝播するための新しいトレーニング方法が定式化されます。非常に困難な問題に関する実験結果は、ニューロンと隠れ層が少ない場合でも、ONNの優れた学習機能を示しています。
Feed-forward, fully-connected Artificial Neural Networks (ANNs) or the so-called Multi-Layer Perceptrons (MLPs) are well-known universal approximators. However, their learning performance varies significantly depending on the function or the solution space that they attempt to approximate. This is mainly because of their homogenous configuration based solely on the linear neuron model. Therefore, while they learn very well those problems with a monotonous, relatively simple and linearly separable solution space, they may entirely fail to do so when the solution space is highly nonlinear and complex. Sharing the same linear neuron model with two additional constraints (local connections and weight sharing), this is also true for the conventional Convolutional Neural Networks (CNNs) and, it is, therefore, not surprising that in many challenging problems only the deep CNNs with a massive complexity and depth can achieve the required diversity and the learning performance. In order to address this drawback and also to accomplish a more generalized model over the convolutional neurons, this study proposes a novel network model, called Operational Neural Networks (ONNs), which can be heterogeneous and encapsulate neurons with any set of operators to boost diversity and to learn highly complex and multi-modal functions or spaces with minimal network complexity and training data. Finally, a novel training method is formulated to back-propagate the error through the operational layers of ONNs. Experimental results over highly challenging problems demonstrate the superior learning capabilities of ONNs even with few neurons and hidden layers.
updated: Fri Oct 18 2019 11:19:56 GMT+0000 (UTC)
published: Fri Feb 15 2019 20:13:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト