arXiv reaDer
顔の表情認識におけるドメイン適応の体系的評価
A Systematic Evaluation of Domain Adaptation in Facial Expression Recognition
顔の表情の認識は商業的に重要なアプリケーションですが、一般的な制限の1つは、サンプル外の分布を予測する必要があることです。この場合、ターゲット画像はモデルがトレーニングされた画像とは非常に異なるプロパティを持つ可能性があります。これらのモデルは、目に見えないターゲットドメインでどの程度うまく機能しますか、またはひどく機能しますか?この論文では、顔の表情認識におけるドメイン適応の体系的な評価を提供します。最先端の転移学習技術と6つの一般的に使用される表情データセット(3つはラボで収集され、3つは「野生」)を使用して、広範なラウンドロビン実験を実施し、分類の精度を調べます。最先端のCNNモデル。また、複数のソースデータセットから転送するモデルの機能を調べるマルチソース実験も実行します。これには、(i)設定内(例:ラボからラボへ)、(ii)クロス設定(例:野生からラボ)、(iii)混合設定(例、ラボおよびワイルドからラボへ)の転送学習実験。転移学習の精度は高くなく、ターゲットデータセット、および程度は低いがソースデータセットによって特異的に変化するという冷静な結果が見つかりました。一般に、転送に最適な設定には、事前にトレーニングされたモデルの重みの微調整が含まれます。設定に関係なく、より多くのデータセットを使用してトレーニングすると、転送のパフォーマンスが向上することがわかります。最後に、特にデプロイされたアプリケーションの場合に、FERモデルの一般化可能性に関するより多くの(そして定期的な)体系的な調査の必要性について説明します。
Facial Expression Recognition is a commercially important application, but one common limitation is that applications often require making predictions on out-of-sample distributions, where target images may have very different properties from the images that the model was trained on. How well, or badly, do these models do on unseen target domains? In this paper, we provide a systematic evaluation of domain adaptation in facial expression recognition. Using state-of-the-art transfer learning techniques and six commonly-used facial expression datasets (three collected in the lab and three "in-the-wild"), we conduct extensive round-robin experiments to examine the classification accuracies for a state-of-the-art CNN model. We also perform multi-source experiments where we examine a model's ability to transfer from multiple source datasets, including (i) within-setting (e.g., lab to lab), (ii) cross-setting (e.g., in-the-wild to lab), (iii) mixed-setting (e.g., lab and wild to lab) transfer learning experiments. We find sobering results that the accuracy of transfer learning is not high, and varies idiosyncratically with the target dataset, and to a lesser extent the source dataset. Generally, the best settings for transfer include fine-tuning the weights of a pre-trained model, and we find that training with more datasets, regardless of setting, improves transfer performance. We end with a discussion of the need for more -- and regular -- systematic investigations into the generalizability of FER models, especially for deployed applications.
updated: Tue Jun 29 2021 14:41:19 GMT+0000 (UTC)
published: Tue Jun 29 2021 14:41:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト