arXiv reaDer
表情認識の学習パラダイムを再考する
Rethinking the Learning Paradigm for Facial Expression Recognition
主観的なクラウドソーシングの注釈と、顔の表情の固有のクラス間類似性により、現実世界の顔の表情認識 (FER) データセットは通常、あいまいな注釈を示します。学習パラダイムを簡素化するために、以前のほとんどの方法は、あいまいな注釈結果を正確なワンホット注釈に変換し、FER モデルをエンドツーエンドの監視付きの方法でトレーニングします。このホワイト ペーパーでは、既存のトレーニング パラダイムを再考し、元のあいまいな注釈を使用して FER モデルをトレーニングするために、弱く監視された戦略を使用する方がよいことを提案します。
Due to the subjective crowdsourcing annotations and the inherent inter-class similarity of facial expressions, the real-world Facial Expression Recognition (FER) datasets usually exhibit ambiguous annotation. To simplify the learning paradigm, most previous methods convert ambiguous annotation results into precise one-hot annotations and train FER models in an end-to-end supervised manner. In this paper, we rethink the existing training paradigm and propose that it is better to use weakly supervised strategies to train FER models with original ambiguous annotation.
updated: Tue Sep 03 2024 09:37:16 GMT+0000 (UTC)
published: Fri Sep 30 2022 12:00:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト