arXiv reaDer
顔の表情の認識が少数のショット学習に出会うとき:共同および代替学習フレームワーク
When Facial Expression Recognition Meets Few-Shot Learning: A Joint and Alternate Learning Framework
人間の感情には、基本的な表情と複合的な表情が含まれます。ただし、現在の顔の表情認識(FER)の研究は、主に基本的な表情に焦点を当てているため、実際のシナリオでは人間の感情の多様性に対処できていません。一方、化合物FERに関する既存の研究は、心理学の専門的な指導の下で骨の折れるように収集されることが多い、豊富なラベル付き化合物発現トレーニングデータに大きく依存しています。この論文では、クロスドメインの数ショット学習設定で複合FERを研究します。この設定では、ターゲットドメインからの新規クラスの数枚の画像のみが参照として必要です。特に、簡単にアクセスできる基本的な式のデータセットでトレーニングされたモデルを使用して、目に見えない複合式を特定することを目指しています。 FERタスクでの限られた基本クラスの問題を軽減するために、2段階の学習フレームワークに基づいて、感情ブランチと類似性ブランチで構成される新しい感情ガイド類似性ネットワーク(EGS-Net)を提案します。具体的には、最初の段階では、類似性ブランチが感情ブランチとマルチタスク方式で共同でトレーニングされます。感情ブランチの正則化により、類似性ブランチが、異なるエピソード間で高度にオーバーラップしているサンプリングされた基本クラスに過剰適合するのを防ぎます。第2段階では、感情ブランチと類似性ブランチが「2人の学生のゲーム」をプレイして交互に学習し、それによって、見えない複合表現に対する類似性ブランチの推論能力をさらに向上させます。ラボ内および野生の複合式データセットの両方での実験結果は、いくつかの最先端の方法に対する提案された方法の優位性を示しています。
Human emotions involve basic and compound facial expressions. However, current research on facial expression recognition (FER) mainly focuses on basic expressions, and thus fails to address the diversity of human emotions in practical scenarios. Meanwhile, existing work on compound FER relies heavily on abundant labeled compound expression training data, which are often laboriously collected under the professional instruction of psychology. In this paper, we study compound FER in the cross-domain few-shot learning setting, where only a few images of novel classes from the target domain are required as a reference. In particular, we aim to identify unseen compound expressions with the model trained on easily accessible basic expression datasets. To alleviate the problem of limited base classes in our FER task, we propose a novel Emotion Guided Similarity Network (EGS-Net), consisting of an emotion branch and a similarity branch, based on a two-stage learning framework. Specifically, in the first stage, the similarity branch is jointly trained with the emotion branch in a multi-task fashion. With the regularization of the emotion branch, we prevent the similarity branch from overfitting to sampled base classes that are highly overlapped across different episodes. In the second stage, the emotion branch and the similarity branch play a "two-student game" to alternately learn from each other, thereby further improving the inference ability of the similarity branch on unseen compound expressions. Experimental results on both in-the-lab and in-the-wild compound expression datasets demonstrate the superiority of our proposed method against several state-of-the-art methods.
updated: Tue Jan 18 2022 07:24:12 GMT+0000 (UTC)
published: Tue Jan 18 2022 07:24:12 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト