表情認識は、人工知能やゲームからマーケティングやヘルスケアに至るまで、ほとんどの分野で大きな関心を集めています。この論文の目的は、人間の顔の画像を7つの基本的な感情のいずれかに分類することです。最終的な畳み込みニューラルネットワーク(CNN)モデルに到達する前に、決定木やニューラルネットワークなど、さまざまなモデルが実験されました。 CNNは、多数のフィルターにより入力の空間的特徴をキャプチャできるため、画像認識タスクにより適しています。提案モデルは、6つの畳み込み層、2つの最大プーリング層、および2つの完全に接続された層で構成されています。さまざまなハイパーパラメーターを調整すると、このモデルの最終精度は0.60になりました。
Facial expression recognition is a topic of great interest in most fields from artificial intelligence and gaming to marketing and healthcare. The goal of this paper is to classify images of human faces into one of seven basic emotions. A number of different models were experimented with, including decision trees and neural networks before arriving at a final Convolutional Neural Network (CNN) model. CNNs work better for image recognition tasks since they are able to capture spacial features of the inputs due to their large number of filters. The proposed model consists of six convolutional layers, two max pooling layers and two fully connected layers. Upon tuning of the various hyperparameters, this model achieved a final accuracy of 0.60.