arXiv reaDer
ニューラルネットは同じモデルを2回学習できますか?決定境界の観点からの再現性と二重降下の調査
Can Neural Nets Learn the Same Model Twice? Investigating Reproducibility and Double Descent from the Decision Boundary Perspective
ニューラルネットワークの決定境界と決定領域を視覚化する方法について説明します。これらの視覚化を使用して、ニューラルネットワークトレーニングの再現性と一般化に関連する問題を調査します。モデルアーキテクチャ(およびそれに関連する誘導バイアス)の変更により、決定境界に目に見える変化が生じる一方で、同じアーキテクチャで複数回実行すると、特にワイドアーキテクチャの場合、強い類似性のある結果が得られることがわかります。また、決定境界法を使用して、二重降下現象を視覚化します。決定境界の再現性はモデルの幅に強く依存することがわかります。内挿のしきい値の近くで、ニューラルネットワークの決定境界は多くの小さな決定領域に断片化され、これらの領域は再現できません。一方、非常に狭く非常に広いネットワークでは、決定領域が比較的少なく、決定境界で高いレベルの再現性があります。観測が凸型モデルの二重降下現象の理論とどのように関連しているかについて説明します。コードはhttps://github.com/somepago/dbVizで入手できます
We discuss methods for visualizing neural network decision boundaries and decision regions. We use these visualizations to investigate issues related to reproducibility and generalization in neural network training. We observe that changes in model architecture (and its associate inductive bias) cause visible changes in decision boundaries, while multiple runs with the same architecture yield results with strong similarities, especially in the case of wide architectures. We also use decision boundary methods to visualize double descent phenomena. We see that decision boundary reproducibility depends strongly on model width. Near the threshold of interpolation, neural network decision boundaries become fragmented into many small decision regions, and these regions are non-reproducible. Meanwhile, very narrows and very wide networks have high levels of reproducibility in their decision boundaries with relatively few decision regions. We discuss how our observations relate to the theory of double descent phenomena in convex models. Code is available at https://github.com/somepago/dbViz
updated: Tue Mar 15 2022 17:51:15 GMT+0000 (UTC)
published: Tue Mar 15 2022 17:51:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト