arXiv reaDer
User independent Emotion Recognition with Residual Signal-Image Network
大規模な生理学的信号によるユーザーに依存しない感情認識は難しい問題です。多くの高度な方法が存在しますが、それらは数十人の被験者を持つ比較的小さなデータセットの下で行われます。ここでは、Res-SINを提案します。これは、Electrodermal Activity(EDA)信号画像を使用して人間の感情を分類する、新しいエンドツーエンドのフレームワークです。まず、凸最適化ベースのEDA(cvxEDA)を適用して信号を分解し、静的および動的な感情の変化をマイニングします。次に、分解された信号を画像に変換して、CNNフレームワークで効果的に処理できるようにします。 Res-SINは、個々の感情機能と外部の感情ベンチマークを組み合わせて、収束を加速します。音楽とEDA信号を含む現在最大の感情データセットであるPMEmoデータセットに対するアプローチを評価します。著者の知る限り、私たちの方法は、457人の被験者からの7962個のEDA信号で大規模な被験者に依存しない感情を分類する最初の試みです。実験結果は、モデルの信頼性を示し、覚醒および価数次元での73.65%および73.43%のバイナリ分類精度をベースラインとして使用できます。
User independent emotion recognition with large scale physiological signals is a tough problem. There exist many advanced methods but they are conducted under relatively small datasets with dozens of subjects. Here, we propose Res-SIN, a novel end-to-end framework using Electrodermal Activity(EDA) signal images to classify human emotion. We first apply convex optimization-based EDA (cvxEDA) to decompose signals and mine the static and dynamic emotion changes. Then, we transform decomposed signals to images so that they can be effectively processed by CNN frameworks. The Res-SIN combines individual emotion features and external emotion benchmarks to accelerate convergence. We evaluate our approach on the PMEmo dataset, the currently largest emotional dataset containing music and EDA signals. To the best of author's knowledge, our method is the first attempt to classify large scale subject-independent emotion with 7962 pieces of EDA signals from 457 subjects. Experimental results demonstrate the reliability of our model and the binary classification accuracy of 73.65% and 73.43% on arousal and valence dimension can be used as a baseline.
updated: Mon Aug 03 2020 01:28:18 GMT+0000 (UTC)
published: Sat Aug 10 2019 05:18:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト