arXiv reaDer
Taskonomy機能を使用した顔のプレゼンテーション攻撃の検出
Face Presentation Attack Detection using Taskonomy Feature
プレゼンテーション攻撃検出(PAD)メソッドの堅牢性と一般化機能は、顔認識システム(FRS)のセキュリティを確保するために重要です。ただし、実際のシナリオでは、プレゼンテーション攻撃(PA)はさまざまであり、収集するのは困難です。既存のPADメソッドは、限られたトレーニングセットに大きく依存しており、未知のPAにうまく一般化することはできません。 PADタスクとは異なり、大量の実際の顔によってトレーニングされた他の顔関連タスク(顔認識や属性編集など)は、さまざまなアプリケーションシナリオに効果的に採用できます。これに触発されて、PAを検出する際の一般化能力を向上させるために、他の顔関連タスクからのタスク分類法(タスク分類法)を適用して顔PADを解決することを提案します。提案された方法は、最初に他の顔関連タスクからタスク固有の機能を導入し、次にグラフ注意ネットワーク(GAT)を使用してクロスモーダルアダプターを設計し、PADタスクに適応するようにそのような機能を再マッピングします。最後に、顔PADは、CNNベースのPA検出器の階層機能と再マッピングされた機能を使用して実現されます。実験結果は、提案された方法が、最先端の方法と比較した場合、複雑でハイブリッドなデータセットにおいて大幅な改善を達成できることを示しています。特に、OULU-NPU、CASIA-FASD、およびIdiap Replay-Attackを使用してトレーニングした場合、MSU-MFSDで5.48%のHTER(Half Total Error Rate)が得られ、ベースラインを7.39%上回っています。コードは公開されます。
The robustness and generalization ability of Presentation Attack Detection (PAD) methods is critical to ensure the security of Face Recognition Systems (FRSs). However, in the real scenario, Presentation Attacks (PAs) are various and hard to be collected. Existing PAD methods are highly dependent on the limited training set and cannot generalize well to unknown PAs. Unlike PAD task, other face-related tasks trained by huge amount of real faces (e.g. face recognition and attribute editing) can be effectively adopted into different application scenarios. Inspired by this, we propose to apply taskonomy (task taxonomy) from other face-related tasks to solve face PAD, so as to improve the generalization ability in detecting PAs. The proposed method, first introduces task specific features from other face-related tasks, then, we design a Cross-Modal Adapter using a Graph Attention Network (GAT) to re-map such features to adapt to PAD task. Finally, face PAD is achieved by using the hierarchical features from a CNN-based PA detector and the re-mapped features. The experimental results show that the proposed method can achieve significant improvements in the complicated and hybrid datasets, when compared with the state-of-the-art methods. In particular, when trained using OULU-NPU, CASIA-FASD, and Idiap Replay-Attack, we obtain HTER (Half Total Error Rate) of 5.48% in MSU-MFSD, outperforming the baseline by 7.39%. Code will be made publicly available.
updated: Mon Nov 22 2021 08:35:26 GMT+0000 (UTC)
published: Mon Nov 22 2021 08:35:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト