arXiv reaDer
高次元での学習は常に外挿に相当します
Learning in High Dimension Always Amounts to Extrapolation
内挿と外挿の概念は、深層学習から関数近似までのさまざまな分野で基本的です。サンプルxが指定されたデータセットの凸包の内側または境界にある場合は常に、内挿が発生します。 xがその凸包の外側にある場合、外挿が発生します。基本的な(誤)概念の1つは、トレーニングデータを正しく補間できるため、最先端のアルゴリズムが非常にうまく機能するというものです。 2番目の(誤)概念は、補間はタスクとデータセット全体で発生するというものです。実際、多くの直感と理論はその仮定に依存しています。私たちは経験的および理論的にこれらの2つの点に反対し、高次元(> 100)のデータセットでは、補間がほぼ確実に発生しないことを示しています。これらの結果は、一般化パフォーマンスの指標としての現在の補間/外挿定義の妥当性に異議を唱えています。
The notion of interpolation and extrapolation is fundamental in various fields from deep learning to function approximation. Interpolation occurs for a sample x whenever this sample falls inside or on the boundary of the given dataset's convex hull. Extrapolation occurs when x falls outside of that convex hull. One fundamental (mis)conception is that state-of-the-art algorithms work so well because of their ability to correctly interpolate training data. A second (mis)conception is that interpolation happens throughout tasks and datasets, in fact, many intuitions and theories rely on that assumption. We empirically and theoretically argue against those two points and demonstrate that on any high-dimensional (>100) dataset, interpolation almost surely never happens. Those results challenge the validity of our current interpolation/extrapolation definition as an indicator of generalization performances.
updated: Fri Oct 29 2021 20:48:06 GMT+0000 (UTC)
published: Mon Oct 18 2021 17:32:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト