arXiv reaDer
1つのラベル、10億の顔:コンピュータビジョンにおける人種カテゴリの使用法と一貫性
One Label, One Billion Faces: Usage and Consistency of Racial Categories in Computer Vision
コンピュータビジョンは広く展開されており、非常に目立ち、社会を変えるアプリケーションがあり、偏見と表現に関する問題が文書化されています。データセットは、公正なコンピュータビジョンの進捗状況をベンチマークするために重要であり、グループの公平性を測定するための人口グループとして幅広い人種カテゴリを採用することがよくあります。同様に、多様性は、多くの場合、カテゴリ別の人種ラベルを割り当ててカウントすることにより、コンピュータビジョンデータセットで測定されます。ただし、人種カテゴリは明確に定義されておらず、時間的および地理的に不安定であり、科学的使用の問題のある歴史があります。データセット全体で使用される人種カテゴリは表面的には類似していますが、人種の認識の複雑さは、あるデータセットによってエンコードされた人種システムが別のデータセットと実質的に矛盾している可能性があることを示唆しています。分類子がデータセットによってエンコードされた人種システムを学習できるという洞察を使用して、顔画像のカテゴリ別人種ラベルを提供するコンピュータビジョンデータセットの実証的研究を実施し、データセット間の一貫性と人種カテゴリの一般化を決定します。名目上同等の人種カテゴリにもかかわらず、各データセットは実質的に一意の人種システムをエンコードし、一部の人種カテゴリはデータセット全体で他のカテゴリよりも体系的に一貫性が低いことがわかります。人種カテゴリがステレオタイプをエンコードし、ステレオタイプへの不適合に基づいてカテゴリから民族グループを除外するという証拠を見つけます。 1つの人種カテゴリで10億人の人間を表すと、人種システムのステレオタイプをエンコードすることで、格差がわかりにくくなり、新しい格差が生まれる可能性があります。人種の抽象的な概念を公平性を測定するためのツールに適切に変換することの難しさは、人種のカテゴリーよりも柔軟で文化を意識した方法の必要性を強調しています。
Computer vision is widely deployed, has highly visible, society altering applications, and documented problems with bias and representation. Datasets are critical for benchmarking progress in fair computer vision, and often employ broad racial categories as population groups for measuring group fairness. Similarly, diversity is often measured in computer vision datasets by ascribing and counting categorical race labels. However, racial categories are ill-defined, unstable temporally and geographically, and have a problematic history of scientific use. Although the racial categories used across datasets are superficially similar, the complexity of human race perception suggests the racial system encoded by one dataset may be substantially inconsistent with another. Using the insight that a classifier can learn the racial system encoded by a dataset, we conduct an empirical study of computer vision datasets supplying categorical race labels for face images to determine the cross-dataset consistency and generalization of racial categories. We find that each dataset encodes a substantially unique racial system, despite nominally equivalent racial categories, and some racial categories are systemically less consistent than others across datasets. We find evidence that racial categories encode stereotypes, and exclude ethnic groups from categories on the basis of nonconformity to stereotypes. Representing a billion humans under one racial category may obscure disparities and create new ones by encoding stereotypes of racial systems. The difficulty of adequately converting the abstract concept of race into a tool for measuring fairness underscores the need for a method more flexible and culturally aware than racial categories.
updated: Wed Feb 03 2021 22:50:04 GMT+0000 (UTC)
published: Wed Feb 03 2021 22:50:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト