大規模なデータセットで事前トレーニングされた機械学習モデルは、顕著な収束性と堅牢性の特性を達成しました。ただし、これらのモデルは、特定の属性とラベルの間の偽の相関を利用することが多く、これは特定のカテゴリ内のほとんどの例でよく見られますが、これらのカテゴリ一般を予測するものではありません。学習された偽相関は、新しいデータで微調整した後でも持続する可能性があり、偽相関を示さない例ではモデルのパフォーマンスが低下します。この研究では、事前トレーニングされたモデルから偽の相関を除去するためのシンプルで非常に効果的な方法を提案します。私たちの方法の重要なアイデアは、偽の属性を持つ少数のサンプル セットを活用し、データ混合を通じてすべてのクラスにわたって偽の属性のバランスを取ることです。私たちは理論的にこの手法の有効性を確認し、さまざまなビジョンおよび NLP タスクにおける最先端のパフォーマンスを実証します。これには、Waterbirds および CelebA で事前トレーニングされた ResNet50、ImageNet で敵対的に事前トレーニングされた ResNet50 からの偽相関の除去が含まれます。 BERT は CivilComments で事前トレーニングされています。
Machine learning models pre-trained on large datasets have achieved remarkable convergence and robustness properties. However, these models often exploit spurious correlations between certain attributes and labels, which are prevalent in the majority of examples within specific categories but are not predictive of these categories in general. The learned spurious correlations may persist even after fine-tuning on new data, which degrades models' performance on examples that do not exhibit the spurious correlation. In this work, we propose a simple and highly effective method to eliminate spurious correlations from pre-trained models. The key idea of our method is to leverage a small set of examples with spurious attributes, and balance the spurious attributes across all classes via data mixing. We theoretically confirm the effectiveness of our method, and empirically demonstrate its state-of-the-art performance on various vision and NLP tasks, including eliminating spurious correlations from pre-trained ResNet50 on Waterbirds and CelebA, adversarially pre-trained ResNet50 on ImageNet, and BERT pre-trained on CivilComments.