arXiv reaDer
RENATA:バイアス軽減のための表現とトレーニングの変更
RENATA: REpreseNtation And Training Alteration for Bias Mitigation
保護された要素または機密性の高い要素に関してAIの公平性を強化するための新しい方法を提案します。この方法では、トレーニングと表現の変更(RENATA)を実行する二重戦略を使用して、AIバイアスの2つの最も顕著な原因を軽減します。これには、次のものが含まれます。a)敵対的な独立性を介した表現学習の変更の使用保護された要因からのデータ表現。 b)過小評価された母集団に関連する敏感な要因の微調整を可能にする生成モデルを使用することにより、バイアスの原因となるデータの不均衡に対処するためのインテリジェントな拡張によるトレーニングセットの変更。画像分析で私たちの方法をテストするとき、実験は、RENATAがベースラインモデルを大幅にまたは完全にデバイアスする一方で、競合するデバイアス方法を上回っていることを示しています。 )EyePACSの場合、および(73.71、11.82)対CelebAの(69.08、21.65)ベースライン。追加の貢献として、バイアス除去パフォーマンスの評価に使用される現在のメトリックの特定の制限を認識し、この研究は、新しい接続デバイアスメトリックを提案します。私たちの実験はまた、提案された方法のパレート効率を評価する際のこれらの新しい測定基準の能力を示しています。
We propose a novel method for enforcing AI fairness with respect to protected or sensitive factors. This method uses a dual strategy performing Training And Representation Alteration (RENATA) for mitigation of two of the most prominent causes of AI bias, including: a) the use of representation learning alteration via adversarial independence, to suppress the bias-inducing dependence of the data representation from protected factors; and b) training set alteration via intelligent augmentation, to address bias-causing data imbalance, by using generative models that allow fine control of sensitive factors related to underrepresented populations. When testing our methods on image analytics, experiments demonstrate that RENATA significantly or fully debiases baseline models while outperforming competing debiasing methods, e.g., with (% overall accuracy, % accuracy gap) of (78.75, 0.5) vs. baseline method's (71.75, 10.5) for EyePACS, and (73.71, 11.82) vs. the (69.08, 21.65) baseline for CelebA. As an additional contribution, recognizing certain limitations in current metrics used for assessing debiasing performance, this study proposes novel conjunctive debiasing metrics. Our experiments also demonstrate the ability of these novel metrics in assessing the Pareto efficiency of the proposed methods.
updated: Fri Dec 11 2020 14:39:10 GMT+0000 (UTC)
published: Fri Dec 11 2020 14:39:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト