arXiv reaDer
最悪の場合のトレーニングの2つの側面とドメイン外の一般化のための統合効果
The Two Dimensions of Worst-case Training and the Integrated Effect for Out-of-domain Generalization
データの「習得が難しい」コンポーネントに重点を置いたトレーニングは、特に堅牢性(たとえば、分布全体の一般化)が重視される設定で、機械学習モデルの一般化を改善する効果的な方法として証明されています。この「習得が難しい」概念を論じている既存の文献は、主にサンプルの次元または特徴の次元のいずれかに沿って拡張されています。このホワイトペーパーでは、これら2つの次元をマージする単純なビューを紹介し、サンプルと特徴の両方の次元の最悪のケースを強調することで、機械学習モデルをトレーニングするための新しいシンプルで効果的なヒューリスティックにつながることを目指しています。 「2次元に沿った最悪の場合」の概念に基づいて、メソッドにW2Dという名前を付けます。アイデアを検証し、標準的なベンチマークに対するその経験的な強さを示します。
Training with an emphasis on "hard-to-learn" components of the data has been proven as an effective method to improve the generalization of machine learning models, especially in the settings where robustness (e.g., generalization across distributions) is valued. Existing literature discussing this "hard-to-learn" concept are mainly expanded either along the dimension of the samples or the dimension of the features. In this paper, we aim to introduce a simple view merging these two dimensions, leading to a new, simple yet effective, heuristic to train machine learning models by emphasizing the worst-cases on both the sample and the feature dimensions. We name our method W2D following the concept of "Worst-case along Two Dimensions". We validate the idea and demonstrate its empirical strength over standard benchmarks.
updated: Sat Apr 09 2022 04:14:55 GMT+0000 (UTC)
published: Sat Apr 09 2022 04:14:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト