arXiv reaDer
分布シフトに関するきめ細かい分析
A Fine-Grained Analysis on Distribution Shift
実世界に機械学習モデルを導入するには、分散シフトに対する堅牢性が重要です。この必要性にもかかわらず、これらのシフトを引き起こす根本的なメカニズムを定義し、複数の異なる分布シフトにわたるアルゴリズムの堅牢性を評価する作業はほとんどありませんでした。この目的のために、さまざまな分布シフトの詳細な分析を可能にするフレームワークを紹介します。合成データセットと実世界のデータセットの両方で5つのカテゴリにグループ化された19の異なるメソッドを評価することにより、現在の最先端のメソッドの全体的な分析を提供します。全体として、85K以上のモデルをトレーニングしています。私たちの実験的フレームワークは、新しいメソッド、シフト、およびデータセットを含めるように簡単に拡張できます。以前の作業〜Gulrajani20とは異なり、標準のERMベースラインを超えて進歩が見られました。特に、事前トレーニングと拡張(学習済みまたはヒューリスティック)は、多くの場合、大きな利益をもたらします。ただし、最良の方法は、さまざまなデータセットやシフトで一貫していません。
Robustness to distribution shifts is critical for deploying machine learning models in the real world. Despite this necessity, there has been little work in defining the underlying mechanisms that cause these shifts and evaluating the robustness of algorithms across multiple, different distribution shifts. To this end, we introduce a framework that enables fine-grained analysis of various distribution shifts. We provide a holistic analysis of current state-of-the-art methods by evaluating 19 distinct methods grouped into five categories across both synthetic and real-world datasets. Overall, we train more than 85K models. Our experimental framework can be easily extended to include new methods, shifts, and datasets. We find, unlike previous work~Gulrajani20, that progress has been made over a standard ERM baseline; in particular, pretraining and augmentations (learned or heuristic) offer large gains in many cases. However, the best methods are not consistent over different datasets and shifts.
updated: Thu Nov 25 2021 20:59:18 GMT+0000 (UTC)
published: Thu Oct 21 2021 17:57:08 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト