arXiv reaDer
部分的に注釈が付けられたグループラベルを使用した公正な分類器の学習
Learning Fair Classifiers with Partially Annotated Group Labels
最近、公平性を意識した学習がますます重要になっていますが、これらの方法のほとんどは、完全に注釈が付けられたグループラベルの可用性を前提として機能することに注意してください。グループラベルの注釈は高価であり、プライバシーの問題と競合する可能性があるため、このような仮定は実際のアプリケーションでは非現実的であることを強調します。このホワイトペーパーでは、部分的に注釈が付けられたグループラベル(Fair-PG)を使用したAlgorithmicFairnessと呼ばれるより実用的なシナリオを検討します。グループラベルのみのデータを使用する既存の公平性手法は、Fair-PGの下で、ターゲットラベルのみの完全なデータのみを使用するバニラトレーニングよりもパフォーマンスがさらに悪いことがわかります。この問題に対処するために、公平性を意識した学習方法に容易に適用できる、単純な信頼ベースのグループラベル割り当て(CGL)戦略を提案します。 CGLは、補助グループ分類子を使用して疑似グループラベルを割り当てます。ここで、ランダムラベルは信頼性の低いサンプルに割り当てられます。最初に、公平性基準の観点から、メソッド設計がバニラ疑似ラベリング戦略よりも優れていることを理論的に示します。次に、UTKFace、CelebA、およびCOMPASデータセットについて、CGLと最先端の公平性を意識した処理方法を組み合わせることにより、ターゲットの精度と公平性の指標がベースラインの方法と比較して共同で改善されることを経験的に示します。さらに、CGLを使用すると、特定のグループラベル付きデータセットを、ターゲットラベルのみを使用した外部データセットで自然に拡張できるため、精度と公平性の両方の指標を向上させることができます。今後の研究で結果を再現できるように、実装を公開します。
Recently, fairness-aware learning have become increasingly crucial, but we note that most of those methods operate by assuming the availability of fully annotated group-labels. We emphasize that such assumption is unrealistic for real-world applications since group label annotations are expensive and can conflict with privacy issues. In this paper, we consider a more practical scenario, dubbed as Algorithmic Fairness with the Partially annotated Group labels (Fair-PG). We observe that the existing fairness methods, which only use the data with group-labels, perform even worse than the vanilla training, which simply uses full data only with target labels, under Fair-PG. To address this problem, we propose a simple Confidence-based Group Label assignment (CGL) strategy that is readily applicable to any fairness-aware learning method. Our CGL utilizes an auxiliary group classifier to assign pseudo group labels, where random labels are assigned to low confident samples. We first theoretically show that our method design is better than the vanilla pseudo-labeling strategy in terms of fairness criteria. Then, we empirically show for UTKFace, CelebA and COMPAS datasets that by combining CGL and the state-of-the-art fairness-aware in-processing methods, the target accuracies and the fairness metrics are jointly improved compared to the baseline methods. Furthermore, we convincingly show that our CGL enables to naturally augment the given group-labeled dataset with external datasets only with target labels so that both accuracy and fairness metrics can be improved. We will release our implementation publicly to make future research reproduce our results.
updated: Mon Nov 29 2021 15:11:18 GMT+0000 (UTC)
published: Mon Nov 29 2021 15:11:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト