標準的な経験的リスク最小化 (ERM) は、入力とそのラベルの間の誤った相関関係により、特定の少数グループ (つまり、陸上の水鳥または水中の陸鳥) ではパフォーマンスが低下する可能性があります。いくつかの研究では、損失の大きいサンプルに焦点を当てることで、最悪のグループの精度が向上しました。この背後にある仮説は、そのような高損失サンプルはスプリアス キュー フリー (SCF) サンプルであるというものです。ただし、実際のシナリオでは、高損失サンプルはノイズの多いラベルを持つサンプルでもある可能性があるため、これらのアプローチは問題になる可能性があります。この問題を解決するために、モデルの予測の不確実性を利用して、ノイズの多いラベルの下で最悪のグループの精度を改善します。これを動機付けるために、不確実性の高いサンプルがバイナリ分類問題の SCF サンプルであることを理論的に示します。この理論的な結果は、予測の不確実性が、ノイズの多いラベル設定で SCF サンプルを識別するための適切な指標であることを意味します。これに基づいて、ノイズの多いラベルに対して堅牢でありながら、モデルが偽の手がかりを学習するのを防ぐ、新しいエントロピーベースのデバイアス (END) フレームワークを提案します。 END フレームワークでは、最初に識別モデルをトレーニングして、予測の不確実性を使用してトレーニング セットから SCF サンプルを取得します。次に、オーバーサンプリングされた SCF セットで拡張されたデータセットで別のモデルがトレーニングされます。実験結果は、ノイズ ラベルとスプリアス キューの両方を考慮したいくつかの実世界のベンチマークで、END フレームワークが他の強力なベースラインよりも優れていることを示しています。
The standard empirical risk minimization (ERM) can underperform on certain minority groups (i.e., waterbirds in lands or landbirds in water) due to the spurious correlation between the input and its label. Several studies have improved the worst-group accuracy by focusing on the high-loss samples. The hypothesis behind this is that such high-loss samples are spurious-cue-free (SCF) samples. However, these approaches can be problematic since the high-loss samples may also be samples with noisy labels in the real-world scenarios. To resolve this issue, we utilize the predictive uncertainty of a model to improve the worst-group accuracy under noisy labels. To motivate this, we theoretically show that the high-uncertainty samples are the SCF samples in the binary classification problem. This theoretical result implies that the predictive uncertainty is an adequate indicator to identify SCF samples in a noisy label setting. Motivated from this, we propose a novel ENtropy based Debiasing (END) framework that prevents models from learning the spurious cues while being robust to the noisy labels. In the END framework, we first train the identification model to obtain the SCF samples from a training set using its predictive uncertainty. Then, another model is trained on the dataset augmented with an oversampled SCF set. The experimental results show that our END framework outperforms other strong baselines on several real-world benchmarks that consider both the noisy labels and the spurious-cues.