arXiv reaDer
シーンの曖昧性解消による人種的に偏りのない肌の色調推定に向けて
Towards Racially Unbiased Skin Tone Estimation via Scene Disambiguation
仮想顔のアバターは、没入型コミュニケーション、ゲーム、メタバースでますます重要な役割を果たすため、それらが包括的であることが重要です。これには、年齢、性別、民族に関係なく、アルベドで表される外観を正確に回復する必要があります。 3D顔の形状の推定に関しては大きな進歩が見られましたが、アルベドの推定はあまり注目されていません。観測された色はアルベドと照明の関数であり、どちらも不明であるため、タスクは基本的にあいまいです。現在の方法は、(1)より明るい色素沈着を好む強く偏った事前分布、および(2)光/アルベドのあいまいさを無視するアルゴリズムソリューションのために、明るい肌の色調に偏っていることを発見しました。これに対処するために、アルベド推定を改善し、したがって公平性を改善するための新しい評価データセット(FAIR)とアルゴリズム(TRUST)を提案します。具体的には、被験者が肌の色の点でバランスが取れている最初の顔のアルベド評価ベンチマークを作成し、Individual Typology Angle(ITA)メトリックを使用して精度を測定します。次に、重要な観察結果に基づいて、光/アルベドのあいまいさに対処します。顔のトリミングされた画像ではなく、シーン全体の画像には、曖昧性解消に使用できる照明に関する重要な情報が含まれています。 TRUSTは、顔領域とシーン画像から取得したグローバルイルミネーション信号の両方を調整することにより、顔のアルベドを後退させます。私たちの実験結果は、精度と公平性の両方の点で、アルベド推定に関する最先端の方法と比較して大幅な改善を示しています。評価ベンチマークとコードは、https://trust.is.tue.mpg.deで調査目的で利用できるようになります。
Virtual facial avatars will play an increasingly important role in immersive communication, games and the metaverse, and it is therefore critical that they be inclusive. This requires accurate recovery of the appearance, represented by albedo, regardless of age, sex, or ethnicity. While significant progress has been made on estimating 3D facial geometry, albedo estimation has received less attention. The task is fundamentally ambiguous because the observed color is a function of albedo and lighting, both of which are unknown. We find that current methods are biased towards light skin tones due to (1) strongly biased priors that prefer lighter pigmentation and (2) algorithmic solutions that disregard the light/albedo ambiguity. To address this, we propose a new evaluation dataset (FAIR) and an algorithm (TRUST) to improve albedo estimation and, hence, fairness. Specifically, we create the first facial albedo evaluation benchmark where subjects are balanced in terms of skin color, and measure accuracy using the Individual Typology Angle (ITA) metric. We then address the light/albedo ambiguity by building on a key observation: the image of the full scene -- as opposed to a cropped image of the face -- contains important information about lighting that can be used for disambiguation. TRUST regresses facial albedo by conditioning both on the face region and a global illumination signal obtained from the scene image. Our experimental results show significant improvement compared to state-of-the-art methods on albedo estimation, both in terms of accuracy and fairness. The evaluation benchmark and code will be made available for research purposes at https://trust.is.tue.mpg.de.
updated: Sat Jul 23 2022 23:20:24 GMT+0000 (UTC)
published: Sun May 08 2022 22:01:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト