arXiv reaDer
ディープネットワークの分析のための学習曲線
Learning Curves for Analysis of Deep Networks
学習曲線は、トレーニングサンプルの数の関数として分類器のテストエラーをモデル化します。以前の研究では、学習曲線を使用してモデルパラメータを選択し、パフォーマンスを推定できることが示されています。学習曲線を使用して、事前トレーニング、アーキテクチャ、データ拡張などの設計の選択を評価する方法を調査します。学習曲線をロバストに推定し、それらのパラメーターをエラーとデータ依存性に抽象化し、さまざまなパラメーター化の有効性を評価する方法を提案します。私たちの実験は、分析のための学習曲線の使用を例示し、いくつかの興味深い観察結果をもたらします。
Learning curves model a classifier's test error as a function of the number of training samples. Prior works show that learning curves can be used to select model parameters and extrapolate performance. We investigate how to use learning curves to evaluate design choices, such as pretraining, architecture, and data augmentation. We propose a method to robustly estimate learning curves, abstract their parameters into error and data-reliance, and evaluate the effectiveness of different parameterizations. Our experiments exemplify use of learning curves for analysis and yield several interesting observations.
updated: Mon Apr 05 2021 17:01:02 GMT+0000 (UTC)
published: Wed Oct 21 2020 14:20:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト