arXiv reaDer
MAFER:顔の表情認識への多重解像度アプローチ
MAFER: a Multi-resolution Approach to Facial Expression Recognition
感情はすべての人間の社会生活の中心的な役割を果たしており、学際的な主題を表す彼らの研究は、多種多様な研究分野を包含しています。特に後者に関しては、顔の表情の分析は、人間とコンピューターの相互作用アプリケーションとの関連性があるため、非常に活発な研究分野です。このような状況では、顔の表情認識(FER)は、人間の顔の表情を認識するタスクです。通常、顔画像は、出力解像度など、本質的にさまざまな特性を持つカメラによって取得されます。顔認識に適用されたディープラーニングモデルは、多重解像度シナリオに対してテストすると、パフォーマンスが低下することがすでに文献で示されています。 FERタスクには、異種ソースで取得できる顔画像の分析が含まれるため、品質の異なる画像が含まれるため、このような場合にも解像度が重要な役割を果たすと予想されます。このような仮説に基づいて、顔の表情の認識を担当するモデルに対する多重解像度トレーニングの利点を証明します。したがって、DCNNをトレーニングして、広範囲の解像度にわたってロバストな予測を生成できるようにするために、MAFERという名前の2段階の学習手順を提案します。 MAFERの関連機能は、タスクに依存しないことです。つまり、他の目的関連の手法を補完的に使用できます。提案されたアプローチの有効性を評価するために、公開されているデータセット、、、およびで広範な実験キャンペーンを実行しました。多重解像度コンテキストの場合、私たちのアプローチでは、学習モデルが現在のSotAを改善し、修正解像度コンテキストで同等の結果を報告することがわかります。最後に、モデルのパフォーマンスを分析し、モデルから生成された深い特徴のより高い識別力を観察します。
Emotions play a central role in the social life of every human being, and their study, which represents a multidisciplinary subject, embraces a great variety of research fields. Especially concerning the latter, the analysis of facial expressions represents a very active research area due to its relevance to human-computer interaction applications. In such a context, Facial Expression Recognition (FER) is the task of recognizing expressions on human faces. Typically, face images are acquired by cameras that have, by nature, different characteristics, such as the output resolution. It has been already shown in the literature that Deep Learning models applied to face recognition experience a degradation in their performance when tested against multi-resolution scenarios. Since the FER task involves analyzing face images that can be acquired with heterogeneous sources, thus involving images with different quality, it is plausible to expect that resolution plays an important role in such a case too. Stemming from such a hypothesis, we prove the benefits of multi-resolution training for models tasked with recognizing facial expressions. Hence, we propose a two-step learning procedure, named MAFER, to train DCNNs to empower them to generate robust predictions across a wide range of resolutions. A relevant feature of MAFER is that it is task-agnostic, i.e., it can be used complementarily to other objective-related techniques. To assess the effectiveness of the proposed approach, we performed an extensive experimental campaign on publicly available datasets: , , and . For a multi-resolution context, we observe that with our approach, learning models improve upon the current SotA while reporting comparable results in fix-resolution contexts. Finally, we analyze the performance of our models and observe the higher discrimination power of deep features generated from them.
updated: Thu May 06 2021 07:26:58 GMT+0000 (UTC)
published: Thu May 06 2021 07:26:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト