arXiv reaDer
深層学習に基づく表情認識研究
Facial Expression Recognition Research Based on Deep Learning
  深層学習の発展により、畳み込みニューラルネットワークの構造はますます複雑になり、オブジェクト認識のパフォーマンスは向上しています。ただし、畳み込みニューラルネットワークの分類メカニズムは未解決のコア問題です。主な問題は、コンボリューションニューラルネットワークのパラメーターが多すぎるため、分析が困難なことです。この論文では、表現認識に基づいて畳み込みニューラルネットワークを設計およびトレーニングし、ネットワークの分類メカニズムを調べます。デコンボリューション可視化手法を使用することにより、コンボリューションニューラルネットワークの極値点が元の画像のピクセル空間に投影され、トレーニングされた表情認識コンボリューションニューラルネットワークが特定の顔のアクションユニットの検出器を形成することを定性的に検証します。同時に、距離関数を設計して、顔の特徴単位の存在と、畳み込みニューラルネットワークの特徴マップ上の応答の最大値との間の距離を測定します。距離が大きいほど、顔の特徴単位に対する特徴マップの感度が高くなります。特徴グラフ内のすべての顔の特徴要素の最大距離を比較することにより、顔の特徴要素と畳み込みニューラルネットワークの特徴マップ間のマッピング関係が決定されます。したがって、我々は、畳み込みニューラルネットワークが表情認識を実現するためのトレーニングプロセスで顔のアクションユニットの検出器を形成していることを検証しました。
With the development of deep learning, the structure of convolution neural network is becoming more and more complex and the performance of object recognition is getting better. However, the classification mechanism of convolution neural networks is still an unsolved core problem. The main problem is that convolution neural networks have too many parameters, which makes it difficult to analyze them. In this paper, we design and train a convolution neural network based on the expression recognition, and explore the classification mechanism of the network. By using the Deconvolution visualization method, the extremum point of the convolution neural network is projected back to the pixel space of the original image, and we qualitatively verify that the trained expression recognition convolution neural network forms a detector for the specific facial action unit. At the same time, we design the distance function to measure the distance between the presence of facial feature unit and the maximal value of the response on the feature map of convolution neural network. The greater the distance, the more sensitive the feature map is to the facial feature unit. By comparing the maximum distance of all facial feature elements in the feature graph, the mapping relationship between facial feature element and convolution neural network feature map is determined. Therefore, we have verified that the convolution neural network has formed a detector for the facial Action unit in the training process to realize the expression recognition.
updated: Mon Oct 21 2019 11:30:32 GMT+0000 (UTC)
published: Mon Apr 22 2019 06:13:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト