一般化は、ディープニューラルネットワーク(DNN)の重要な機能です。ただし、DNNの一般化能力の信頼できる尺度を、その性質のみを介して提供することは困難です。本論文では、ネットワークのスパース性に基づいて一般化ギャップを推定するための新しい方法を提案します。私たちの方法では、2つの重要な量が最初に提案されます。それらは一般化能力と密接な関係があり、トレーニング結果のみから直接計算できます。次に、一般化ギャップの正確な推定を行うために、2つの主要な量を含む単純な線形モデルが構築されます。人気のあるデータセットで広範囲の一般化ギャップを持つDNNをトレーニングすることにより、キー量と線形モデルがDNNの一般化ギャップを推定するための効率的なツールになり得ることを示します。
Generalization is the key capability for deep neural networks (DNNs). However, it is challenging to give a reliable measure of the generalization ability of a DNN via only its nature. In this paper, we propose a novel method for estimating the generalization gap based on network sparsity. In our method, two key quantities are proposed first. They have close relationship with the generalization ability and can be calculated directly from the training results alone. Then a simple linear model involving two key quantities are constructed to give accurate estimation of the generalization gap. By training DNNs with a wide range of generalization gap on popular datasets, we show that our key quantities and linear model could be efficient tools for estimating the generalization gap of DNNs.