arXiv reaDer
Deformable Convolutional LSTM for Human Body Emotion Recognition
人々は無数の方法で感情を表現します。最も重要なものの中には、ヒューマンコンピュータインタラクション(HCI)などのさまざまな分野で多くの用途がある全身表現があります。人間の感情認識における最も重要な課題の1つは、人々が顔や体を使ってさまざまな方法で同じ感情を表現することです。最近、多くの方法がディープニューラルネットワーク(DNN)を使用してこれらの課題を克服しようとしています。ただし、これらの方法のほとんどは、画像または顔の表情のみに基づいており、認識精度に悪影響を与える可能性のあるスケーリングや回転など、画像で発生する可能性のある変形を考慮していませんでした。この作業では、変形可能な畳み込みに関する最近の研究に動機付けられて、変形可能な動作を畳み込み長期短期記憶(ConvLSTM)のコアに組み込み、画像内のこれらの変形に対するロバスト性を向上させ、その結果、感情認識の精度を向上させます。任意の長さのビデオからのタスク。 GEMEPデータセットで実験を行い、検証セットでの人体全体の感情認識のタスクで98.8%の最先端の精度を達成しました。
People represent their emotions in a myriad of ways. Among the most important ones is whole body expressions which have many applications in different fields such as human-computer interaction (HCI). One of the most important challenges in human emotion recognition is that people express the same feeling in various ways using their face and their body. Recently many methods have tried to overcome these challenges using Deep Neural Networks (DNNs). However, most of these methods were based on images or on facial expressions only and did not consider deformation that may happen in the images such as scaling and rotation which can adversely affect the recognition accuracy. In this work, motivated by recent researches on deformable convolutions, we incorporate the deformable behavior into the core of convolutional long short-term memory (ConvLSTM) to improve robustness to these deformations in the image and, consequently, improve its accuracy on the emotion recognition task from videos of arbitrary length. We did experiments on the GEMEP dataset and achieved state-of-the-art accuracy of 98.8% on the task of whole human body emotion recognition on the validation set.
updated: Tue Oct 27 2020 21:01:09 GMT+0000 (UTC)
published: Tue Oct 27 2020 21:01:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト