顔認識は、コンピュータビジョンで最も人気があり長年にわたるトピックの1つです。ディープラーニング技術と大規模データセットの最近の開発により、ディープフェイス認識は目覚ましい進歩を遂げ、多くの実際のアプリケーションで広く使用されています。自然な画像またはビデオフレームを入力として指定すると、エンドツーエンドの深い顔認識システムが顔の特徴を出力して認識します。これを実現するために、一般的なエンドツーエンドシステムは、通常、顔検出、顔の位置合わせ、顔の表現という3つの重要な要素で構築されます。顔検出は、画像またはフレーム内の顔を特定します。次に、顔の位置合わせを進めて、顔を標準ビューに調整し、正規化されたピクセルサイズにトリミングします。最後に、顔の表現の段階で、識別可能な特徴が認識のために位置合わせされた顔から抽出されます。現在、3つの要素はすべてディープ畳み込みニューラルネットワークの手法によって実現されています。この調査記事では、深層が繁栄して以来、エンドツーエンドの深層顔認識の各要素の最近の進歩について包括的なレビューを示します。学習技術はそれらの能力を大幅に改善しました。まず、エンドツーエンドのディープフェイス認識の概要を示します。次に、各要素の進歩をそれぞれ確認し、現在のアルゴリズム設計、評価指標、データセット、パフォーマンス比較、既存の課題、将来の研究の有望な方向性など、多くの側面をカバーします。この調査を通じて、私たちは2つの側面で貢献をもたらしたいと考えています。1つは、読者がサブカテゴリで非常に強力なベースラインスタイルである方法を簡単に特定してさらに調査できることです。第二に、最先端のエンドツーエンドの顔認識システムをゼロから確立するための適切な方法を採用することもできます。
Face recognition is one of the most popular and long-standing topics in computer vision. With the recent development of deep learning techniques and large-scale datasets, deep face recognition has made remarkable progress and been widely used in many real-world applications. Given a natural image or video frame as input, an end-to-end deep face recognition system outputs the face feature for recognition. To achieve this, a typical end-to-end system is generally built with three key elements: face detection, face alignment, and face representation. The face detection locates faces in the image or frame. Then, the face alignment is proceeded to calibrate the faces to a canonical view and crop them to a normalized pixel size. Finally, in the stage of face representation, the discriminative features are extracted from the aligned face for recognition. Nowadays, all of the three elements are fulfilled by the technique of deep convolutional neural network.In this survey article, we present a comprehensive review about the recent advance of each element of the end-to-end deep face recognition, since the thriving deep learning techniques have greatly improved the capability of them. To start with, we present an overview of the end-to-end deep face recognition. Then, we review the advance of each element, respectively, covering many aspects such as the to-date algorithm designs, evaluation metrics, datasets, performance comparison, existing challenges, and promising directions for future research. Through this survey, we wish to bring contributions in two aspects: first, readers can conveniently identify the methods which are quite strong-baseline style in the subcategory for further exploration; second, one can also employ suitable methods for establishing a state-of-the-art end-to-end face recognition system from scratch.