過剰パラメータ化されたレジームで適切に一般化するディープニューラルネットワークの能力は、重要な研究の対象となっています。ネットワークは原則としてはるかに大きな関数クラスを表すことができますが、オーバーパラメーター化されたオートエンコーダーは記憶、最適化プロセスで学習した関数をトレーニング例に集中するように制限する誘導バイアスの形式を示します。特に、単一層の完全に接続されたオートエンコーダーが、トレーニング例の(非線形)スパンにデータを投影することを証明します。さらに、深く完全に接続されたオートエンコーダーは、トレーニング例で局所的に収縮するマップを学習するため、オートエンコーダーを繰り返すとトレーニング例に収束することを示します。最後に、深さが必要であることを証明し、畳み込みオートエンコーダーの暗記にも十分であるという経験的証拠を提供します。この誘導バイアスを理解することで、古典的な統計理論では現在説明されていない過剰パラメータ化されたディープニューラルネットワークの一般化特性に光を当てることができます。
The ability of deep neural networks to generalize well in the overparameterized regime has become a subject of significant research interest. We show that overparameterized autoencoders exhibit memorization, a form of inductive bias that constrains the functions learned through the optimization process to concentrate around the training examples, although the network could in principle represent a much larger function class. In particular, we prove that single-layer fully-connected autoencoders project data onto the (nonlinear) span of the training examples. In addition, we show that deep fully-connected autoencoders learn a map that is locally contractive at the training examples, and hence iterating the autoencoder results in convergence to the training examples. Finally, we prove that depth is necessary and provide empirical evidence that it is also sufficient for memorization in convolutional autoencoders. Understanding this inductive bias may shed light on the generalization properties of overparametrized deep neural networks that are currently unexplained by classical statistical theory.