ディープラーニングベースの表情認識(FER)は、ここ数年で多くの注目を集めています。既存のディープラーニングベースのFERメソッドのほとんどは、ドメインの知識を十分に考慮していないため、代表的な特徴を抽出できません。この作品では、Faceal Motion Prior Networks(FMPN)という新しいFERフレームワークを提案します。特に、顔の筋肉の動きのある領域に焦点を合わせるために、顔のマスクを生成する追加ブランチを導入します。顔面マスクの学習をガイドするために、中立面と対応する表情豊かな面との平均差をトレーニングガイダンスとして使用して、事前のドメイン知識を組み込むことを提案します。 3つの表情ベンチマークデータセットに関する広範な実験により、提案された方法の有効性が、最先端のアプローチと比較して実証されています。
Deep learning based facial expression recognition (FER) has received a lot of attention in the past few years. Most of the existing deep learning based FER methods do not consider domain knowledge well, which thereby fail to extract representative features. In this work, we propose a novel FER framework, named Facial Motion Prior Networks (FMPN). Particularly, we introduce an addition branch to generate a facial mask so as to focus on facial muscle moving regions. To guide the facial mask learning, we propose to incorporate prior domain knowledge by using the average differences between neutral faces and the corresponding expressive faces as the training guidance. Extensive experiments on three facial expression benchmark datasets demonstrate the effectiveness of the proposed method, compared with the state-of-the-art approaches.