この作品は、顔の感情認識(FER)の独学学習の概念を通じて得られた教師なし表現を生成するためのさまざまな戦略について説明します。アイデアは、オートエンコーダの初期化、アーキテクチャ、およびトレーニングデータを変更することにより、多様性を促進する補完的な表現を作成することです。最終的な分類方法として、SVM、バギング、ランダムフォレスト、および動的アンサンブル選択方法が評価されます。 Leave-one-subject-outプロトコルを使用したJaffeおよびCohn-Kanadeデータセットの実験結果は、提案された多様な表現に基づくFER手法が、教師なし特徴学習も探索する最先端のアプローチと比べて遜色がないことを示しています。
This work describes different strategies to generate unsupervised representations obtained through the concept of self-taught learning for facial emotion recognition (FER). The idea is to create complementary representations promoting diversity by varying the autoencoders' initialization, architecture, and training data. SVM, Bagging, Random Forest, and a dynamic ensemble selection method are evaluated as final classification methods. Experimental results on Jaffe and Cohn-Kanade datasets using a leave-one-subject-out protocol show that FER methods based on the proposed diverse representations compare favorably against state-of-the-art approaches that also explore unsupervised feature learning.