既存の顔認識データセットには通常、顔認識の開発を妨げるオクルージョンサンプルがありません。特にCOVID-19コロナウイルスの流行時には、マスクを着用することがウイルスの拡散を防ぐ効果的な手段になりました。既存のデータセットでトレーニングされた従来のCNNベースの顔認識モデルは、重度の咬合にはほとんど効果がありません。この目的のために、私たちはシミュレートされた咬合顔認識データセットを開拓しました。特に、まずさまざまなメガネやマスクをオクルージョンとして収集し、オクルージョン属性(オクルージョンオブジェクト、テクスチャ、カラー)をランダムに組み合わせて、よりリアルなオクルージョンタイプを多数実現します。次に、通常の咬合習慣で顔画像の適切な位置にそれらをカバーします。さらに、元の通常の顔画像と遮蔽された顔画像を合理的に組み合わせて、Webface-OCCと呼ばれる最終的なデータセットを形成します。多様性と安定性を確保するために、さまざまなオクルージョンタイプを使用して、10,575人の被験者の804,704の顔画像をカバーしています。公開データセットでの広範な実験は、データセットによって再トレーニングされたArcFaceが最先端を大幅に上回っていることを示しています。 Webface-OCCは、https://github.com/Baojin-Huang/Webface-OCCで入手できます。
The existing face recognition datasets usually lack occlusion samples, which hinders the development of face recognition. Especially during the COVID-19 coronavirus epidemic, wearing a mask has become an effective means of preventing the virus spread. Traditional CNN-based face recognition models trained on existing datasets are almost ineffective for heavy occlusion. To this end, we pioneer a simulated occlusion face recognition dataset. In particular, we first collect a variety of glasses and masks as occlusion, and randomly combine the occlusion attributes (occlusion objects, textures,and colors) to achieve a large number of more realistic occlusion types. We then cover them in the proper position of the face image with the normal occlusion habit. Furthermore, we reasonably combine original normal face images and occluded face images to form our final dataset, termed as Webface-OCC. It covers 804,704 face images of 10,575 subjects, with diverse occlusion types to ensure its diversity and stability. Extensive experiments on public datasets show that the ArcFace retrained by our dataset significantly outperforms the state-of-the-arts. Webface-OCC is available at https://github.com/Baojin-Huang/Webface-OCC.