A Multi-component CNN-RNN Approach for Dimensional Emotion Recognition in-the-wild
 このホワイトペーパーでは、提供された感情ビデオの視覚分析による次元感情認識に焦点を当て、1分間の漸進的感情認識(OMG-感情)チャレンジへのアプローチを示します。このアプローチは、関連する大規模なAffWildエモーションデータベース用に開発した畳み込みおよび回帰(CNN-RNN)ディープニューラルアーキテクチャに基づいています。 CNNコンポーネントで生成された複数の機能の組み合わせをRNNサブネットで探索できるようにすることで、このアーキテクチャを拡張および適合させました。私たちの目標は、それぞれの視覚トレーニングデータセットを学習しながら、OMG-Emotion視覚検証データセットで最高のパフォーマンスを得ることです。拡張された実験により、これらのデータセットの価数および覚醒感情の次元を推定するための最良のアーキテクチャがもたらされました。
This paper presents our approach to the One-Minute Gradual-Emotion Recognition (OMG-Emotion) Challenge, focusing on dimensional emotion recognition through visual analysis of the provided emotion videos. The approach is based on a Convolutional and Recurrent (CNN-RNN) deep neural architecture we have developed for the relevant large AffWild Emotion Database. We extended and adapted this architecture, by letting a combination of multiple features generated in the CNN component be explored by RNN subnets. Our target has been to obtain best performance on the OMG-Emotion visual validation data set, while learning the respective visual training data set. Extended experimentation has led to best architectures for the estimation of the values of the valence and arousal emotion dimensions over these data sets.
updated: Fri Dec 13 2019 23:32:41 GMT+0000 (UTC)
published: Thu May 03 2018 17:54:44 GMT+0000 (UTC)
