ディープコンボリューショナルニューラルネットワークアプローチ(CNN)の進歩の恩恵を受けて、多くの顔検出アルゴリズムは、制約のないアプリケーションで精度と非常に高速の点で最先端のパフォーマンスを達成しています。ただし、パブリックデータセットが不足しているため、顔画像の向き、複雑な背景と照明、デフォーカス、カメラキャプチャ画像の照明の変化により、制約のない環境でのIDドキュメントの顔検出は十分に研究されていません。この問題をより効率的に解決するために、一般的な画像に基づいた3つの最新の顔検出方法、つまり、Cascade-CNN、MTCNN、およびPCNを調査します。 。そのため、MIDV-500データセットは、IDドキュメントの最大かつ最も困難なデータセットであり、3つの方法を評価するために使用されます。評価結果は、野生の複雑な環境でのIDドキュメントでの顔検出の現在の方法のパフォーマンスと制限を示しています。これらの結果は、ID文書のカメラキャプチャ画像での顔検出タスクが困難であり、将来の作業で改善するためのスペースを提供することを示しています。
Benefiting from the advance of deep convolutional neural network approaches (CNNs), many face detection algorithms have achieved state-of-the-art performance in terms of accuracy and very high speed in unconstrained applications. However, due to the lack of public datasets and due to the variation of the orientation of face images, the complex background and lighting, defocus and the varying illumination of camera captured images, face detection on identity documents under unconstrained environments has not been sufficiently studied. To address this problem more efficiently, we survey three state-of-the-art face detection methods based on general images, i.e. Cascade-CNN, MTCNN and PCN, for face detection in camera captured images of identity documents, given different image quality assessments. For that, The MIDV-500 dataset, which is the largest and most challenging dataset for identity documents, is used to evaluate the three methods. The evaluation results show the performance and the limitations of the current methods for face detection on identity documents under the wild complex environments. These results show that the face detection task in camera captured images of identity documents is challenging, providing a space to improve in the future works.