arXiv reaDer
MorphNet:認識バイアスを検出するためのワンショット顔合成GAN
MorphNet: One-Shot Face Synthesis GAN for Detecting Recognition Bias
顔認識ネットワークのバイアスを検出するには、特定の属性のみが制御された方法で変化するサンプルを使用して、テスト対象のネットワークをプローブすると便利です。ただし、対象の属性を特定の方法で制御して、十分に大きなデータセットをキャプチャすることは困難です。この作品では、これまでに見たことのない人々の画像に特定の頭のポーズと表情の調整を適用するシミュレーターについて説明します。シミュレーターは、最初に3Dモーフィング可能なモデルを提供された画像に適合させ、目的の頭のポーズと顔の表情のコントロールを適用してから、モデルを画像にレンダリングします。次に、元の画像とレンダリングされたモーフィング可能なモデルを条件とする条件付き生成的敵対的ネットワーク(GAN)を使用して、新しい表情と頭のポーズで元の人物の画像を生成します。これを条件付きGAN--MorphNetと呼びます。 MorphNetを使用して生成された画像は、元の画像内の人物のIDを保存し、頭のポーズと表情に対する提供された制御により、ポーズと表情に関する顔認識ディープネットワークの堅牢性の問題を特定するためのテストセットを作成できます。 MorphNetによって生成された画像は、トレーニングデータが不足している場合にデータ拡張としても機能します。新しいポーズと表情で顔の小さなデータセットを拡張することにより、拡張とデータの不足に応じて、認識パフォーマンスが最大9%向上することを示します。
To detect bias in face recognition networks, it can be useful to probe a network under test using samples in which only specific attributes vary in some controlled way. However, capturing a sufficiently large dataset with specific control over the attributes of interest is difficult. In this work, we describe a simulator that applies specific head pose and facial expression adjustments to images of previously unseen people. The simulator first fits a 3D morphable model to a provided image, applies the desired head pose and facial expression controls, then renders the model into an image. Next, a conditional Generative Adversarial Network (GAN) conditioned on the original image and the rendered morphable model is used to produce the image of the original person with the new facial expression and head pose. We call this conditional GAN -- MorphNet. Images generated using MorphNet conserve the identity of the person in the original image, and the provided control over head pose and facial expression allows test sets to be created to identify robustness issues of a facial recognition deep network with respect to pose and expression. Images generated by MorphNet can also serve as data augmentation when training data are scarce. We show that by augmenting small datasets of faces with new poses and expressions improves the recognition performance by up to 9% depending on the augmentation and data scarcity.
updated: Wed Dec 09 2020 18:43:03 GMT+0000 (UTC)
published: Wed Dec 09 2020 18:43:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト