顔アンチスプーフィング (FAS) は、自動顔認識システムの完全性を保護するために不可欠なメカニズムです。大幅な進歩にもかかわらず、実世界のアプリケーションへの既存のアプローチの一般化は依然として困難です。この制限は、公開されている FAS データセットの多様性の欠如と不足に起因する可能性があり、トレーニング中のオーバーフィッティングやテスト中の飽和につながることがよくあります。量に関しては、スプーフィング対象の数が重要な決定要因です。ほとんどのデータセットは、2,000 未満の被験者で構成されています。多様性に関しては、データセットの大部分は、反復的な機械的プロセスを使用して制御された環境で収集されたなりすましサンプルで構成されています。このデータ収集方法では、サンプルが均一化され、シナリオの多様性が失われます。これらの欠点に対処するために、制約のない設定で収集された大規模で多様な FAS データセットである Wild Face Anti-Spoofing (WFAS) データセットを導入します。私たちのデータセットには、321,751 人のなりすまし対象の 853,729 枚の画像と、148,169 人の生きている対象者の 529,571 枚の画像が含まれており、量が大幅に増加しています。さらに、私たちのデータセットには、2D と 3D の両方の形式を含む 17 のプレゼンテーション攻撃 (PA) を含む、さまざまなシナリオとさまざまな商用センサーにまたがる、インターネットから取得したスプーフィング データが組み込まれています。この新しいデータ収集戦略は、FAS データの多様性を著しく高めます。 WFAS データセットとプロトコル 1 (既知のタイプ) を活用して、CVPR2023 ワークショップで Wild Face Anti-Spoofing Challenge を主催します。また、Protocol 1 と Protocol 2 (Unknown-Type) を使用して、代表的な方法を詳細に評価します。課題の結果とベンチマーク ベースラインの詳細な調査を通じて、洞察に満ちた分析を提供し、将来の研究のための潜在的な手段を提案します。データセットは Insightface でリリースされています。
Face anti-spoofing (FAS) is an essential mechanism for safeguarding the integrity of automated face recognition systems. Despite substantial advancements, the generalization of existing approaches to real-world applications remains challenging. This limitation can be attributed to the scarcity and lack of diversity in publicly available FAS datasets, which often leads to overfitting during training or saturation during testing. In terms of quantity, the number of spoof subjects is a critical determinant. Most datasets comprise fewer than 2,000 subjects. With regard to diversity, the majority of datasets consist of spoof samples collected in controlled environments using repetitive, mechanical processes. This data collection methodology results in homogenized samples and a dearth of scenario diversity. To address these shortcomings, we introduce the Wild Face Anti-Spoofing (WFAS) dataset, a large-scale, diverse FAS dataset collected in unconstrained settings. Our dataset encompasses 853,729 images of 321,751 spoof subjects and 529,571 images of 148,169 live subjects, representing a substantial increase in quantity. Moreover, our dataset incorporates spoof data obtained from the internet, spanning a wide array of scenarios and various commercial sensors, including 17 presentation attacks (PAs) that encompass both 2D and 3D forms. This novel data collection strategy markedly enhances FAS data diversity. Leveraging the WFAS dataset and Protocol 1 (Known-Type), we host the Wild Face Anti-Spoofing Challenge at the CVPR2023 workshop. Additionally, we meticulously evaluate representative methods using Protocol 1 and Protocol 2 (Unknown-Type). Through an in-depth examination of the challenge outcomes and benchmark baselines, we provide insightful analyses and propose potential avenues for future research. The dataset is released under Insightface.