この論文では、子供とロボットの相互作用などの困難なシナリオでのマルチキューの影響認識の問題に対処します。この目標に向けて、通常は顔の表情だけに焦点を当てる従来の方法とは対照的に、顔の表情とともに身体の表情を活用する感情の自動認識のための方法を提案します。深層学習ベースの方法は、階層的なマルチラベル注釈とマルチステージ損失を使用し、共同および個別の両方でトレーニングすることができ、個々のモダリティと全身の感情の両方の計算モデルを提供します。私たちは、私たちによって収集された感情表現の挑戦的な子供とロボットの相互作用データベース、および大人による行動された感情のGEMEPパブリックデータベースでメソッドを評価し、提案された方法が顔のみの表現ベースラインよりも有意に優れた結果を達成することを示します。
In this paper we address the problem of multi-cue affect recognition in challenging scenarios such as child-robot interaction. Towards this goal we propose a method for automatic recognition of affect that leverages body expressions alongside facial ones, as opposed to traditional methods that typically focus only on the latter. Our deep-learning based method uses hierarchical multi-label annotations and multi-stage losses, can be trained both jointly and separately, and offers us computational models for both individual modalities, as well as for the whole body emotion. We evaluate our method on a challenging child-robot interaction database of emotional expressions collected by us, as well as on the GEMEP public database of acted emotions by adults, and show that the proposed method achieves significantly better results than facial-only expression baselines.