arXiv reaDer
交絡のもとでの反事実データの増強を再考する
Rethinking Counterfactual Data Augmentation Under Confounding
反事実データの拡張は、機械学習モデルのトレーニング データの交絡バイアスを軽減する方法として最近登場しました。偽の相関などのこれらのバイアスは、データ生成プロセスで観察されるさまざまな交絡変数と観察されない変数によって発生します。この論文では、交絡バイアスが下流の分類器にどのような影響を与えるかを正式に分析し、反事実データの増強に基づいた解決策への因果関係の観点を提示します。私たちは、交絡バイアスを除去することが不変特徴を学習する手段としてどのように機能し、最終的には観察されたデータ分布を超えた一般化に役立つかを探ります。さらに、下流の分類子に対する交絡効果の影響を効果的に軽減する、反事実画像を生成するための単純かつ強力なアルゴリズムを紹介します。 MNIST バリアントと CelebA データセットの実験を通じて、私たちのアプローチの有効性と実用性を実証します。
Counterfactual data augmentation has recently emerged as a method to mitigate confounding biases in the training data for a machine learning model. These biases, such as spurious correlations, arise due to various observed and unobserved confounding variables in the data generation process. In this paper, we formally analyze how confounding biases impact downstream classifiers and present a causal viewpoint to the solutions based on counterfactual data augmentation. We explore how removing confounding biases serves as a means to learn invariant features, ultimately aiding in generalization beyond the observed data distribution. Additionally, we present a straightforward yet powerful algorithm for generating counterfactual images, which effectively mitigates the influence of confounding effects on downstream classifiers. Through experiments on MNIST variants and the CelebA datasets, we demonstrate the effectiveness and practicality of our approach.
updated: Mon May 29 2023 16:20:23 GMT+0000 (UTC)
published: Mon May 29 2023 16:20:23 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト