本研究では、リンクされたニューロンという概念を用いて、内部共変量シフトと不活性なニューロンの問題に対する新しい解決策を提案する。ニューロンの連結を2つの制約条件で定義する。第一に、リンケージ内のすべてのニューロンの活性化は同じ動作点を持つ必要がある。すなわち、すべてのニューロンが入力重みを共有している。第二に、ニューロンのセットは、活性化関数の入力に関してゼロでない勾配を持つリンケージのメンバーが少なくとも1つ存在する場合にのみ、リンクされる。これは、活性化関数のどのような入力に対しても、平坦ではなくゼロではない領域で動作するリンケージのメンバーが少なくとも1つ存在することを意味する。この単純な変更は、ネットワークの学習ダイナミクスに大きな影響を与える。本稿では、この提案の結果を探り、この種のユニットを使用することで、内部共変量シフトが暗黙のうちに解決されることを示す。この結果、リンク型ニューロンを使用することで、アーキテクチャやアルゴリズムのトリックなしに、任意の大規模なネットワークを学習することができ、バッチ正規化のような再正規化スキームを使用する必要がなくなり、必要な学習時間が半分になる。また、標準化された入力データが必要であるという問題も解決されている。結果として、リンケージを使用したユニットは、前述の問題を効果的に解決するだけでなく、最先端の技術に対しても競争力のある代替手段となり、非常に有望な結果が得られた。
This work proposes a novel solution to the problem of internal covariate shift and dying neurons using the concept of linked neurons. We define the neuron linkage in terms of two constraints: first, all neuron activations in the linkage must have the same operating point. That is to say, all of them share input weights. Secondly, a set of neurons is linked if and only if there is at least one member of the linkage that has a non-zero gradient in regard to the input of the activation function. This means that for any input in the activation function, there is at least one member of the linkage that operates in a non-flat and non-zero area. This simple change has profound implications in the network learning dynamics. In this article we explore the consequences of this proposal and show that by using this kind of units, internal covariate shift is implicitly solved. As a result of this, the use of linked neurons allows to train arbitrarily large networks without any architectural or algorithmic trick, effectively removing the need of using re-normalization schemes such as Batch Normalization, which leads to halving the required training time. It also solves the problem of the need for standarized input data. Results show that the units using the linkage not only do effectively solve the aforementioned problems, but are also a competitive alternative with respect to state-of-the-art with very promising results.