arXiv reaDer
MetaShift:コンテキスト分布シフトとトレーニングの競合を評価するためのデータセットのデータセット
MetaShift: A Dataset of Datasets for Evaluating Contextual Distribution Shifts and Training Conflicts
信頼性の高いアプリケーションでは、さまざまなデータ分散にわたる機械学習モデルのパフォーマンスを理解することが非常に重要です。これに動機付けられて、分布の変化をキャプチャするベンチマークデータセットのキュレーションにますます焦点が当てられています。既存のベンチマークは価値がありますが、それらの多くには少数のシフトしか含まれておらず、異なるシフト間で何が異なるかについての体系的な注釈がないという点で制限されています。この課題に対処するために、MetaShift(410クラスにわたる12,868セットの自然画像のコレクション)を紹介します。 Visual Genomeとそのアノテーションの自然な異質性を活用して、MetaShiftを構築します。重要な構造のアイデアは、メタデータを使用して画像をクラスター化することです。メタデータは、個別のデータ分布を表す各画像(「車の猫」や「バスルームの猫」など)のコンテキストを提供します。 MetaShiftには2つの重要な利点があります。1つは、以前に利用可能だったものよりも桁違いに多くの自然なデータシフトが含まれていることです。次に、各データセットの固有の説明と、任意の2つのデータセット間の分布シフトの量を測定する距離スコアを明示的に説明します。データシフトに対してロバストなトレーニングモデルに関する最近のいくつかの提案のベンチマークにおけるMetaShiftの有用性を示します。シフトが中程度であり、大きなシフトに対して体系的な利点がない方法がない場合、単純な経験的リスク最小化が最も効果的であることがわかります。また、MetaShiftがモデルトレーニング中のデータサブセット間の競合を視覚化するのにどのように役立つかを示します。
Understanding the performance of machine learning models across diverse data distributions is critically important for reliable applications. Motivated by this, there is a growing focus on curating benchmark datasets that capture distribution shifts. While valuable, the existing benchmarks are limited in that many of them only contain a small number of shifts and they lack systematic annotation about what is different across different shifts. We present MetaShift--a collection of 12,868 sets of natural images across 410 classes--to address this challenge. We leverage the natural heterogeneity of Visual Genome and its annotations to construct MetaShift. The key construction idea is to cluster images using its metadata, which provides context for each image (e.g. "cats with cars" or "cats in bathroom") that represent distinct data distributions. MetaShift has two important benefits: first, it contains orders of magnitude more natural data shifts than previously available. Second, it provides explicit explanations of what is unique about each of its data sets and a distance score that measures the amount of distribution shift between any two of its data sets. We demonstrate the utility of MetaShift in benchmarking several recent proposals for training models to be robust to data shifts. We find that the simple empirical risk minimization performs the best when shifts are moderate and no method had a systematic advantage for large shifts. We also show how MetaShift can help to visualize conflicts between data subsets during model training.
updated: Mon Feb 14 2022 07:40:03 GMT+0000 (UTC)
published: Mon Feb 14 2022 07:40:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト