Two-stream Convolutional Networks for Multi-frame Face Anti-spoofing
顔のなりすまし防止は、顔認識のセキュリティを保護するための重要なタスクです。以前の作業のほとんどは、識別可能で一般化可能な機能をキャプチャするのに苦労するか、ほとんどの工業製品では利用できない補助情報に依存しています。ビデオ分類作業に触発されて、ライブ面となりすまし面の主な違いをキャプチャするための効率的な2ストリームモデルを提案します。これは、それぞれマルチフレームとRGBの違いを入力として受け取ります。 2つの反対の融合方向を持つ特徴ピラミッドモジュールとピラミッドプーリングモジュールは、特徴表現を強化するために適用されます。 Siw、Oulu-NPU、CASIA-MFSD、およびReplay-Attackのデータセットで提案された方法を評価します。結果は、私たちのモデルが、はるかに少ないパラメーターサイズで、ほとんどのデータセットのプロトコルで最先端の結果を達成していることを示しています。
Face anti-spoofing is an important task to protect the security of face recognition. Most of previous work either struggle to capture discriminative and generalizable feature or rely on auxiliary information which is unavailable for most of industrial product. Inspired by the video classification work, we propose an efficient two-stream model to capture the key differences between live and spoof faces, which takes multi-frames and RGB difference as input respectively. Feature pyramid modules with two opposite fusion directions and pyramid pooling modules are applied to enhance feature representation. We evaluate the proposed method on the datasets of Siw, Oulu-NPU, CASIA-MFSD and Replay-Attack. The results show that our model achieves the state-of-the-art results on most of datasets' protocol with much less parameter size.
