顔のパーツや頭のコンポーネントを含む、人物の顔と頭のきめ細かなセマンティック セグメンテーションは、近年大きく進歩しています。ただし、あいまいなオクルージョンと大きなポーズのバリエーションを考慮することは特に困難です。これらの困難を克服するために、Mask-FPAN と呼ばれる新しいフレームワークを提案します。半教師あり方法でオクルージョンされた面を解析することを学習するオクルージョン モジュールを使用します。特に、顔のランドマークのローカリゼーション、顔のオクルージョンの推定、および検出された頭の姿勢が考慮されます。 UV GAN と組み合わせた 3D モーフィング可能な顔モデルは、2D 顔解析の堅牢性を向上させます。さらに、FaceOccMask-HQ と CelebAMaskOcc-HQ という名前の 2 つの新しいデータセットを顔ペアリング作業用に導入します。提案された Mask-FPAN フレームワークは、実際の顔解析の問題に対処し、挑戦的な顔データセットの最先端技術と比較して、MIOU で 0.7353 から 0.9013 への大幅なパフォーマンスの向上を示しています。
Fine-grained semantic segmentation of a person's face and head, including facial parts and head components, has progressed a great deal in recent years. However, it remains a challenging task, whereby considering ambiguous occlusions and large pose variations are particularly difficult. To overcome these difficulties, we propose a novel framework termed Mask-FPAN. It uses a de-occlusion module that learns to parse occluded faces in a semi-supervised way. In particular, face landmark localization, face occlusionstimations, and detected head poses are taken into account. A 3D morphable face model combined with the UV GAN improves the robustness of 2D face parsing. In addition, we introduce two new datasets named FaceOccMask-HQ and CelebAMaskOcc-HQ for face paring work. The proposed Mask-FPAN framework addresses the face parsing problem in the wild and shows significant performance improvements with MIOU from 0.7353 to 0.9013 compared to the state-of-the-art on challenging face datasets.