FairCal: Fairness Calibration for Face Verification
広く使用されているにもかかわらず、顔認識モデルにはバイアスがあります。誤検知(顔の不正確な一致)の確率は、顔の民族性などの敏感な属性に強く依存します。その結果、これらのモデルは、特に法執行機関によって使用される場合、マイノリティグループに不釣り合いに悪影響を与える可能性があります。バイアス削減方法の大部分にはいくつかの欠点があります。エンドツーエンドの再トレーニングアプローチを使用し、プライバシーの問題のために実行できない可能性があり、多くの場合精度が低下します。別のアプローチは、事前にトレーニングされたモデルの機能を使用して、より公平な決定分類器を構築する後処理方法です。ただし、それでも欠点があります。精度が低下する(AGENDA、FTC)か、さまざまな偽陽性率(FSN)を再調整する必要があります。この作業では、トレーニング後のアプローチであるフェアネスキャリブレーション(FairCal)メソッドを紹介します。これは、(i)モデルの精度を向上させる(最先端の機能を向上させる)、(ii)公平にキャリブレーションされた確率を生成する、(iii )偽陽性率のギャップを大幅に減らし、(iv)機密属性の知識を必要とせず、(v)再トレーニング、追加モデルのトレーニング、または再調整を必要としません。それを顔認証のタスクに適用し、上記のすべての利点を備えた最先端の結果を取得します。
Despite being widely used, face recognition models suffer from bias: the probability of a false positive (incorrect face match) strongly depends on sensitive attributes such as the ethnicity of the face. As a result, these models can disproportionately and negatively impact minority groups, particularly when used by law enforcement. The majority of bias reduction methods have several drawbacks: they use an end-to-end retraining approach, may not be feasible due to privacy issues, and often reduce accuracy. An alternative approach is post-processing methods that build fairer decision classifiers using the features of pre-trained models. However, they still have drawbacks: they reduce accuracy (AGENDA, FTC), or require retuning for different false positive rates (FSN). In this work, we introduce the Fairness Calibration (FairCal) method, a post-training approach that: (i) increases model accuracy (improving the state-of-the-art), (ii) produces fairly-calibrated probabilities, (iii) significantly reduces the gap in the false positive rates, (iv) does not require knowledge of the sensitive attribute, and (v) does not require retraining, training an additional model, or retuning. We apply it to the task of Face Verification, and obtain state-of-the-art results with all the above advantages.
updated: Thu Oct 07 2021 20:52:11 GMT+0000 (UTC)
published: Mon Jun 07 2021 16:26:26 GMT+0000 (UTC)
