Facial Emotion Recognition: State of the Art Performance on FER2013
顔の感情認識(FER)は、臨床診療や行動記述などの人間とコンピューターの相互作用にとって重要です。コンピュータモデルによる正確で堅牢なFERは、人間の顔の不均一性や、顔のポーズや照明の違いなどの画像のバリエーションのために、依然として困難です。 FERのすべての手法の中で、深層学習モデル、特に畳み込みニューラルネットワーク(CNN)は、その強力な自動特徴抽出と計算効率により、大きな可能性を示しています。この作業では、FER2013データセットで最高の単一ネットワーク分類精度を達成します。 VGGNetアーキテクチャを採用し、ハイパーパラメータを厳密に微調整し、さまざまな最適化手法を試します。私たちの知る限り、私たちのモデルは、追加のトレーニングデータを使用せずに、FER2013で73.28%の最先端の単一ネットワーク精度を達成しています。
Facial emotion recognition (FER) is significant for human-computer interaction such as clinical practice and behavioral description. Accurate and robust FER by computer models remains challenging due to the heterogeneity of human faces and variations in images such as different facial pose and lighting. Among all techniques for FER, deep learning models, especially Convolutional Neural Networks (CNNs) have shown great potential due to their powerful automatic feature extraction and computational efficiency. In this work, we achieve the highest single-network classification accuracy on the FER2013 dataset. We adopt the VGGNet architecture, rigorously fine-tune its hyperparameters, and experiment with various optimization methods. To our best knowledge, our model achieves state-of-the-art single-network accuracy of 73.28 % on FER2013 without using extra training data.
updated: Sat May 08 2021 04:20:53 GMT+0000 (UTC)
published: Sat May 08 2021 04:20:53 GMT+0000 (UTC)
