arXiv reaDer
インスタンスベースの学習における交差検証エラーと投票の理論的分析
Theoretical Analyses of Cross-Validation Error and Voting in Instance-Based Learning
 このホワイトペーパーは、例からの教師あり学習のためのアルゴリズムの相互検証テストにおけるエラーの一般的な理論から始まります。これらの例は属性と値のペアで記述され、値は記号であると想定されています。相互検証には、一連のトレーニング例と一連のテスト例が必要です。予測される属性の値は、トレーニングセットでは学習者に知られていますが、テストセットでは不明です。この理論は、交差検証エラーには2つの要素があることを示しています。トレーニングセットのエラー(不正確さ)とノイズに対する感度(不安定性)です。この一般理論は、インスタンスベースの学習における投票に適用されます。テストセットの例を考えると、典型的なインスタンスベースの学習アルゴリズムは、トレーニングセットのテスト例にk個の最近傍(k個の最も類似した例)を投票することにより、指定された属性を予測します。投票は、インスタンスベースの学習の安定性(ノイズに対する耐性)を高めることを目的としていますが、理論的な分析では、投票が不安定になる可能性がある状況が示されています。この理論は、投票が安定しており、精度に悪影響を及ぼさないことを保証することにより、相互検証エラーを最小限に抑える方法を提案しています。
This paper begins with a general theory of error in cross-validation testing of algorithms for supervised learning from examples. It is assumed that the examples are described by attribute-value pairs, where the values are symbolic. Cross-validation requires a set of training examples and a set of testing examples. The value of the attribute that is to be predicted is known to the learner in the training set, but unknown in the testing set. The theory demonstrates that cross-validation error has two components: error on the training set (inaccuracy) and sensitivity to noise (instability). This general theory is then applied to voting in instance-based learning. Given an example in the testing set, a typical instance-based learning algorithm predicts the designated attribute by voting among the k nearest neighbors (the k most similar examples) to the testing example in the training set. Voting is intended to increase the stability (resistance to noise) of instance-based learning, but a theoretical analysis shows that there are circumstances in which voting can be destabilizing. The theory suggests ways to minimize cross-validation error, by insuring that voting is stable and does not adversely affect accuracy.
updated: Wed Dec 11 2002 17:36:00 GMT+0000 (UTC)
published: Wed Dec 11 2002 17:36:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト