顔認識は、コンピュータビジョンで最も人気があり長年のトピックの1つです。ディープラーニング技術と大規模データセットの最近の開発により、ディープフェイス認識は目覚ましい進歩を遂げ、多くの実世界のアプリケーションで広く使用されています。自然な画像またはビデオフレームを入力として指定すると、エンドツーエンドの深い顔認識システムが顔の特徴を出力して認識します。これを実現するために、一般的なエンドツーエンドシステムは、顔検出、顔の位置合わせ、顔の表現という3つの重要な要素で構築されています。顔検出は、画像またはフレーム内の顔を特定します。次に、面の位置合わせを進めて、面を標準ビューに合わせて調整し、正規化されたピクセルサイズでトリミングします。最後に、顔の表現の段階で、識別可能な特徴が認識のために位置合わせされた顔から抽出されます。現在、3つの要素はすべて、深い畳み込みニューラルネットワークの手法によって実現されています。この調査記事では、各要素の最近の進歩に関する包括的なレビューを紹介します。まず、エンドツーエンドのディープフェイス認識の概要を示します。次に、各要素の進歩をそれぞれ確認し、現在のアルゴリズム設計、評価メトリック、データセット、パフォーマンス比較、既存の課題、将来の研究の有望な方向性など、多くの側面をカバーします。また、各要素が後続の要素と全体的なシステムに与える影響について詳細に説明します。この調査を通じて、私たちは2つの側面で貢献をもたらしたいと考えています。1つは、読者がサブカテゴリで非常に強力なベースラインスタイルである方法を便利に識別してさらに調査できることです。第二に、最先端のエンドツーエンドの顔認識システムをゼロから確立するための適切な方法を採用することもできます。
Face recognition is one of the most popular and long-standing topics in computer vision. With the recent development of deep learning techniques and large-scale datasets, deep face recognition has made remarkable progress and been widely used in many real-world applications. Given a natural image or video frame as input, an end-to-end deep face recognition system outputs the face feature for recognition. To achieve this, a typical end-to-end system is built with three key elements: face detection, face alignment, and face representation. The face detection locates faces in the image or frame. Then, the face alignment is proceeded to calibrate the faces to the canonical view and crop them with a normalized pixel size. Finally, in the stage of face representation, the discriminative features are extracted from the aligned face for recognition. Nowadays, all of the three elements are fulfilled by the technique of deep convolutional neural network. In this survey article, we present a comprehensive review about the recent advance of each element. To start with, we present an overview of the end-to-end deep face recognition. Then, we review the advance of each element, respectively, covering many aspects such as the to-date algorithm designs, evaluation metrics, datasets, performance comparison, existing challenges, and promising directions for future research. Also, we provide a detailed discussion about the effect of each element on its subsequent elements and the holistic system. Through this survey, we wish to bring contributions in two aspects: first, readers can conveniently identify the methods which are quite strong-baseline style in the subcategory for further exploration; second, one can also employ suitable methods for establishing a state-of-the-art end-to-end face recognition system from scratch.