Automatic Group Cohesiveness Detection With Multi-modal Features
  グループの凝集性は、グループのダイナミクスとグループのパフォーマンスにおいて説得力があり、よく研究される構成です。人々のグループの膨大な数のウェブ画像を使用して、グループの凝集性を検出する効果的な方法を開発できます。このホワイトペーパーでは、グループベースの結束予測のカテゴリーにおける第7回野生の感情認識(EmotiW 2019)グランドチャレンジの自動グループ結束予測方法を紹介します。タスクは、画像内のグループの凝集度を予測することです。この問題に取り組むために、顔の特徴、スケルトンの特徴、およびシーンの特徴について個別に訓練される回帰モデルを含むハイブリッドネットワークが提案されています。各特徴に対応する予測回帰値は、最終的な凝集強度のために融合されます。実験結果は、提案されたハイブリッドネットワークが効果的であり、有望な改善を行うことを示しています。 0.544のベースラインMSEを上回るテストセットで0.444の平均二乗誤差(MSE)が達成されます。
Group cohesiveness is a compelling and often studied composition in group dynamics and group performance. The enormous number of web images of groups of people can be used to develop an effective method to detect group cohesiveness. This paper introduces an automatic group cohesiveness prediction method for the 7th Emotion Recognition in the Wild (EmotiW 2019) Grand Challenge in the category of Group-based Cohesion Prediction. The task is to predict the cohesive level for a group of people in images. To tackle this problem, a hybrid network including regression models which are separately trained on face features, skeleton features, and scene features is proposed. Predicted regression values, corresponding to each feature, are fused for the final cohesive intensity. Experimental results demonstrate that the proposed hybrid network is effective and makes promising improvements. A mean squared error (MSE) of 0.444 is achieved on the testing sets which outperforms the baseline MSE of 0.5.
updated: Wed Oct 02 2019 20:04:42 GMT+0000 (UTC)
published: Wed Oct 02 2019 20:04:42 GMT+0000 (UTC)
