arXiv reaDer
ボディランゲージデータセットを使用した騒々しい学生のトレーニングは、顔の表情の認識を改善します
Noisy Student Training using Body Language Dataset Improves Facial Expression Recognition
野生のビデオからの表情認識は、ラベル付けされたトレーニングデータが豊富にないため、困難な作業です。大規模なDNN(ディープニューラルネットワーク)アーキテクチャとアンサンブル手法により、パフォーマンスは向上しましたが、データが不十分なため、ある時点ですぐに飽和状態に達します。このホワイトペーパーでは、ラベル付けされたデータセットとラベル付けされていないデータセット(Body Language Dataset-BoLD)の組み合わせを利用する自己学習法を使用します。実験的分析は、騒々しい学生ネットワークを繰り返しトレーニングすることで、大幅に優れた結果を達成するのに役立つことを示しています。さらに、私たちのモデルは顔の異なる領域を分離し、パフォーマンスをさらに向上させるマルチレベルの注意メカニズムを使用してそれらを個別に処理します。私たちの結果は、他の単一モデルと比較して、提案された方法がベンチマークデータセットCK +およびAFEW 8.0で最先端のパフォーマンスを達成することを示しています。
Facial expression recognition from videos in the wild is a challenging task due to the lack of abundant labelled training data. Large DNN (deep neural network) architectures and ensemble methods have resulted in better performance, but soon reach saturation at some point due to data inadequacy. In this paper, we use a self-training method that utilizes a combination of a labelled dataset and an unlabelled dataset (Body Language Dataset - BoLD). Experimental analysis shows that training a noisy student network iteratively helps in achieving significantly better results. Additionally, our model isolates different regions of the face and processes them independently using a multi-level attention mechanism which further boosts the performance. Our results show that the proposed method achieves state-of-the-art performance on benchmark datasets CK+ and AFEW 8.0 when compared to other single models.
updated: Wed Feb 24 2021 19:11:20 GMT+0000 (UTC)
published: Thu Aug 06 2020 13:45:52 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト