arXiv reaDer
ニューラルネットワーク部分空間の学習
Learning Neural Network Subspaces
最近の観察により、ニューラルネットワークの最適化ランドスケープの理解が進み、(1)多様なソリューションを含む高精度のパスと(2)パフォーマンスの向上を提供するより広い最小値の存在が明らかになりました。多様なパスを観察する以前の方法では、複数のトレーニングを実行する必要があります。対照的に、プロパティ(1)と(2)の両方を、単一のメソッドと単一のトレーニング実行で活用することを目指しています。 1つのモデルのトレーニングと同様の計算コストで、高精度ニューラルネットワークの直線、曲線、およびシンプレックスを学習します。これらのニューラルネットワーク部分空間には、アンサンブル可能な多様なソリューションが含まれており、トレーニングコストなしで独立してトレーニングされたネットワークのアンサンブルパフォーマンスに近づきます。さらに、部分空間の中点を使用すると、ノイズにラベルを付けるための精度、キャリブレーション、および堅牢性が向上し、確率的重み平均を上回ります。
Recent observations have advanced our understanding of the neural network optimization landscape, revealing the existence of (1) paths of high accuracy containing diverse solutions and (2) wider minima offering improved performance. Previous methods observing diverse paths require multiple training runs. In contrast we aim to leverage both property (1) and (2) with a single method and in a single training run. With a similar computational cost as training one model, we learn lines, curves, and simplexes of high-accuracy neural networks. These neural network subspaces contain diverse solutions that can be ensembled, approaching the ensemble performance of independently trained networks without the training cost. Moreover, using the subspace midpoint boosts accuracy, calibration, and robustness to label noise, outperforming Stochastic Weight Averaging.
updated: Sun Sep 12 2021 23:16:26 GMT+0000 (UTC)
published: Sat Feb 20 2021 23:26:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト