この論文では、同一人物の顔画像のセットを正規化された画像に揃えながら、部分的なオクルージョン、極端な表情、著しい照明変動などの異常値を除去する問題を研究しています。このモデルは、ノイズの疎行列と整列画像のランク1行列の合計として、整列不良画像の行列を分解できるように、最適な画像領域変換を求めています。画像の変換は教師なしの方法で学習されます。つまり、モデルには地上と真理が揃った画像は不要です。具体的には、生成的敵対ネットワーク(GAN)の顕著な非線形変換機能を利用し、低ランク生成とスパースノイズ制約でガイドして顔の位置合わせを実現します。提案されたモデルの有効性を実際の顔データベースでの広範な実験で検証し、既存の方法よりも高い精度と効率を実証します。
This paper studies the problem of aligning a set of face images of the same individual into a normalized image while removing the outliers like partial occlusion, extreme facial expression as well as significant illumination variation. Our model seeks an optimal image domain transformation such that the matrix of misaligned images can be decomposed as the sum of a sparse matrix of noise and a rank-one matrix of aligned images. The image transformation is learned in an unsupervised manner, which means that ground-truth aligned images are unnecessary for our model. Specifically, we make use of the remarkable non-linear transforming ability of generative adversarial network(GAN) and guide it with low-rank generation as well as sparse noise constraint to achieve the face alignment. We verify the efficacy of the proposed model with extensive experiments on real-world face databases, demonstrating higher accuracy and efficiency than existing methods.