この作業では、視覚認識タスクにおける保護された変数(性別など)に関する固有のバイアスを測定および軽減するためのフレームワークを提示します。訓練されたモデルは、偏ったデータセットから予想されるものを超えて、性別とターゲットラベルの関連付けを大幅に増幅することを示します。驚くべきことに、各ラベルが性別ごとに等しく発生するようにデータセットがバランスされている場合でも、学習モデルはデータがバランスされていないかのように、ラベルと性別の間の関連を増幅します!これを緩和するために、敵対的アプローチを採用して、保護された変数に対応する不要な機能をディープニューラルネットワークの中間表現から削除し、その有効性の詳細な分析を提供します。 COCOデータセット(オブジェクト)とimSituデータセット(アクション)の2つのデータセットの実験では、元のモデルのほとんどの精度を維持しながら、性別バイアス増幅の減少が示されています。
In this work, we present a framework to measure and mitigate intrinsic biases with respect to protected variables --such as gender-- in visual recognition tasks. We show that trained models significantly amplify the association of target labels with gender beyond what one would expect from biased datasets. Surprisingly, we show that even when datasets are balanced such that each label co-occurs equally with each gender, learned models amplify the association between labels and gender, as much as if data had not been balanced! To mitigate this, we adopt an adversarial approach to remove unwanted features corresponding to protected variables from intermediate representations in a deep neural network -- and provide a detailed analysis of its effectiveness. Experiments on two datasets: the COCO dataset (objects), and the imSitu dataset (actions), show reductions in gender bias amplification while maintaining most of the accuracy of the original models.