arXiv reaDer
大きなポーズの顔認識を改善するための3DGAN
A 3D GAN for Improved Large-pose Facial Recognition
深い畳み込みニューラルネットワークを使用した顔認識は、顔画像の大規模なデータセットの可用性に依存しています。 IDの多くの例が必要であり、ネットワークがクラス内変動に対するロバスト性を学習するためには、IDごとに多種多様な画像が必要です。実際には、そのようなデータセット、特にポーズの適切なバリエーションを含むデータセットを取得することは困難です。生成的敵対的ネットワーク(GAN)は、現実的な合成画像を生成できるため、この問題に対する潜在的な解決策を提供します。しかし、最近の研究では、ポーズをアイデンティティから解きほぐす現在の方法は不十分であることが示されています。この作業では、野生の画像から非線形テクスチャモデルを学習するために、3Dモーフィング可能なモデルをGANのジェネレータに組み込みます。これにより、アイデンティティを損なうことなく、新しい合成アイデンティティの生成、ポーズと表現の操作が可能になります。私たちの合成データは、挑戦的なCFPWおよびクロスポーズLFWデータセットで評価されたパフォーマンスで顔認識ネットワークのトレーニングを強化するために使用されます。
Facial recognition using deep convolutional neural networks relies on the availability of large datasets of face images. Many examples of identities are needed, and for each identity, a large variety of images are needed in order for the network to learn robustness to intra-class variation. In practice, such datasets are difficult to obtain, particularly those containing adequate variation of pose. Generative Adversarial Networks (GANs) provide a potential solution to this problem due to their ability to generate realistic, synthetic images. However, recent studies have shown that current methods of disentangling pose from identity are inadequate. In this work we incorporate a 3D morphable model into the generator of a GAN in order to learn a nonlinear texture model from in-the-wild images. This allows generation of new, synthetic identities, and manipulation of pose and expression without compromising the identity. Our synthesised data is used to augment training of facial recognition networks with performance evaluated on the challenging CFPW and Cross-Pose LFW datasets.
updated: Fri Dec 18 2020 22:41:15 GMT+0000 (UTC)
published: Fri Dec 18 2020 22:41:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト