ディープ ニューラル ネットワークによって抽出される特徴の多様性は、モデルの一般化能力を強化し、それに応じてさまざまな学習タスクでのパフォーマンスを向上させるために重要です。自然界の表情認識は、現実世界のシナリオで遮られた画像から識別的で有益な特徴を抽出するというこの分野に存在する課題のために、近年関心を集めています。この論文では、識別特徴を学習する際のモデル容量を強化するために、最先端の表情認識アーキテクチャの CNN レイヤーによって抽出された特徴を多様化するメカニズムを提案します。提案されたアプローチの有効性を評価するために、このメカニズムを 2 つの最先端のモデルに組み込み、(i) 注意ベースのモデルでローカル/グローバルな特徴を多様化し、(ii) 異なる学習者によって抽出された特徴を多様化します。アンサンブルベースモデル。 AffectNet、FER+、および RAF-DB の 3 つのよく知られている実在の表情認識データセットに関する実験結果は、RAF-DB で 89.99% の最先端のパフォーマンスを達成し、私たちの方法の有効性を示しています。 、FER+ で 89.34%、AffectNet データセットで 60.02% の競合精度。
Diversity of the features extracted by deep neural networks is important for enhancing the model generalization ability and accordingly its performance in different learning tasks. Facial expression recognition in the wild has attracted interest in recent years due to the challenges existing in this area for extracting discriminative and informative features from occluded images in real-world scenarios. In this paper, we propose a mechanism to diversify the features extracted by CNN layers of state-of-the-art facial expression recognition architectures for enhancing the model capacity in learning discriminative features. To evaluate the effectiveness of the proposed approach, we incorporate this mechanism in two state-of-the-art models to (i) diversify local/global features in an attention-based model and (ii) diversify features extracted by different learners in an ensemble-based model. Experimental results on three well-known facial expression recognition in-the-wild datasets, AffectNet, FER+, and RAF-DB, show the effectiveness of our method, achieving the state-of-the-art performance of 89.99% on RAF-DB, 89.34% on FER+ and the competitive accuracy of 60.02% on AffectNet dataset.