arXiv reaDer
Negativa による迷惑行為: データ増強による疑似相関の調整
Nuisances via Negativa: Adjusting for Spurious Correlations via Data Augmentation
予測タスクでは、そのタスクのさまざまな設定で同じようにラベルに関連する機能が存在します。これらはセマンティック機能またはセマンティクスです。ラベルとの関係が変化する機能は迷惑です。たとえば、自然画像から牛を検出する場合、頭の形はセマンティックですが、牛の画像は草の背景を持っていることがよくありますが、必ずしもそうとは限らないため、背景が邪魔になります。迷惑行為とラベルの間の関係は設定全体で不安定であり、その結果、迷惑行為とラベルの関係を利用するモデルは、これらの関係が変化するとパフォーマンスの低下に直面します。迷惑行為の直接的な知識は、そのような変化に対して堅牢なモデルを構築するのに役立ちますが、ラベルや共変量を超えた追加の注釈が必要です。この論文では、データ拡張によって堅牢なモデルを生成する代替方法を開発します。これらのデータ拡張はセマンティック情報を破壊して、迷惑行為が予測を促進する場所を特定して調整するモデルを生成します。水鳥の分類、自然言語推論 (NLI)、胸部 X 線での心肥大の検出など、複数の分布外 (OOD) タスクでさまざまなスプリアス相関を回避する方法を強化する際のセマンティック破損を研究しています。
In prediction tasks, there exist features that are related to the label in the same way across different settings for that task; these are semantic features or semantics. Features with varying relationships to the label are nuisances. For example, in detecting cows from natural images, the shape of the head is a semantic but because images of cows often have grass backgrounds but not always, the background is a nuisance. Relationships between a nuisance and the label are unstable across settings and, consequently, models that exploit nuisance-label relationships face performance degradation when these relationships change. Direct knowledge of a nuisance helps build models that are robust to such changes, but requires extra annotations beyond labels and covariates. In this paper, we develop an alternative way to produce robust models by data augmentation. These data augmentations corrupt semantic information to produce models that identify and adjust for where nuisances drive predictions. We study semantic corruptions in powering different spurious-correlation avoiding methods on multiple out-of distribution (OOD) tasks like classifying waterbirds, natural language inference (NLI), and detecting cardiomegaly in chest X-rays.
updated: Wed Mar 01 2023 06:00:47 GMT+0000 (UTC)
published: Tue Oct 04 2022 01:40:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト