arXiv reaDer
顔提示攻撃検出のためのアンサンブル スタッキングによるドメインの汎化
Domain Generalization via Ensemble Stacking for Face Presentation Attack Detection
顔プレゼンテーション攻撃検出 (PAD) は、スプーフィング攻撃から顔認識システムを保護する上で極めて重要な役割を果たします。フェイス PAD メソッドの設計は大きく進歩しましたが、目に見えないテスト ドメインにうまく一般化できるモデルを開発することは、依然として大きな課題です。さらに、なりすまし攻撃にはさまざまな種類があるため、ディープ ニューラル ネットワークのトレーニングに十分な数のサンプルを含むデータセットを作成するのは骨の折れる作業です。この作業は、合成データを作成し、ディープ ラーニング ベースの統合フレームワークを導入して、顔 PAD の一般化能力を向上させることで、これらの課題に対処します。特に、合成データは、アルファ合成に基づいて時空間ワープ画像と静止画像をブレンドするビデオ蒸留技術を提案することによって生成されます。提案された合成サンプルは、異なるアルファ重みを増やすことで生成できるため、積み重ねられたアンサンブルとして知られる特定のタイプのアンサンブル学習を利用して複数の分類器をトレーニングします。他の人への専門家。これに動機付けられて、メタ分類器を使用してこれらの専門家から共同で学習し、アンサンブルを開発するときに、お互いからの補完的な情報を活用して、目に見えないターゲット ドメインにより適切に対処したり、より有用にしたりできるようにします。 4 つの PAD データベース CASIA-MFSD (6.97 %)、Replay-Attack (33.49%)、MSU-MFSD (4.02%)、および OULU-NPU (10.91%)) で半分の合計エラー率 (HTER) を使用した実験結果は、堅牢性を示しています。大規模な合成データを使用したアンサンブル学習を使用して、プレゼンテーション攻撃の検出を進めるための新しい可能性を切り開きます。
Face presentation attack detection (PAD) plays a pivotal role in securing face recognition systems against spoofing attacks. Although great progress has been made in designing face PAD methods, developing a model that can generalize well to an unseen test domain remains a significant challenge. Moreover, due to different types of spoofing attacks, creating a dataset with a sufficient number of samples for training deep neural networks is a laborious task. This work addresses these challenges by creating synthetic data and introducing a deep learning-based unified framework for improving the generalization ability of the face PAD. In particular, synthetic data is generated by proposing a video distillation technique that blends a spatiotemporal warped image with a still image based on alpha compositing. Since the proposed synthetic samples can be generated by increasing different alpha weights, we train multiple classifiers by taking the advantage of a specific type of ensemble learning known as a stacked ensemble, where each such classifier becomes an expert in its own domain but a non-expert to others. Motivated by this, a meta-classifier is employed to learn from these experts collaboratively so that when developing an ensemble, they can leverage complementary information from each other to better tackle or be more useful for an unseen target domain. Experimental results using half total error rates (HTERs) on four PAD databases CASIA-MFSD (6.97 %), Replay-Attack (33.49%), MSU-MFSD (4.02%), and OULU-NPU (10.91%)) demonstrate the robustness of the method and open up new possibilities for advancing presentation attack detection using ensemble learning with large-scale synthetic data.
updated: Thu Jan 05 2023 16:44:36 GMT+0000 (UTC)
published: Thu Jan 05 2023 16:44:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト