arXiv reaDer
説明可能でプライバシーが保護された人間の動きが認識に影響を与えることに向けて
Towards Explainable, Privacy-Preserved Human-Motion Affect Recognition
人間の運動特性は、神経疾患や気分障害の進行を監視するために使用されます。感情の知覚も体の姿勢や動きと交互になっているため、人間の歩行からの感情認識を使用して、気分の変化を定量的に監視できます。多くの既存のソリューションでは、これを実現するために、生の位置データまたは手動で抽出された特徴を使用した浅い機械学習モデルを使用することがよくあります。ただし、歩行は、人間の被験者を識別するために使用できる多くの表現力の高い特性で構成されており、ほとんどのソリューションは、被験者のプライバシーを無視して、これに対処できません。この作品は、人間の感情と生体認証を解きほぐすための新しいディープニューラルネットワークアーキテクチャを紹介します。特に、人間の動きの特徴の解きほぐされた潜在表現を学習するために、マルチエンコーダーオートエンコーダーディープニューラルネットワークをトレーニングするためのクロスサブジェクト転送学習手法を提案します。歩行データから被験者の生体認証を解きほぐすことにより、影響認識のパフォーマンスが従来の方法よりも優れている一方で、被験者のプライバシーが維持されることを示します。さらに、Guided Grad-CAMを活用して、歩行サイクル全体にわたるモデルの決定のグローバルな説明を提供します。 3D時間関節信号と手動で抽出された特徴の両方を使用して、感情を認識する際の既存の方法に対する私たちの方法の有効性を評価します。また、このデータを簡単に悪用して、被験者の身元を明らかにできることも示しています。私たちの方法は、最大7%の改善を示し、平均的な歩行サイクル全体で最も重要な影響を与える関節を強調しています。
Human motion characteristics are used to monitor the progression of neurological diseases and mood disorders. Since perceptions of emotions are also interleaved with body posture and movements, emotion recognition from human gait can be used to quantitatively monitor mood changes. Many existing solutions often use shallow machine learning models with raw positional data or manually extracted features to achieve this. However, gait is composed of many highly expressive characteristics that can be used to identify human subjects, and most solutions fail to address this, disregarding the subject's privacy. This work introduces a novel deep neural network architecture to disentangle human emotions and biometrics. In particular, we propose a cross-subject transfer learning technique for training a multi-encoder autoencoder deep neural network to learn disentangled latent representations of human motion features. By disentangling subject biometrics from the gait data, we show that the subject's privacy is preserved while the affect recognition performance outperforms traditional methods. Furthermore, we exploit Guided Grad-CAM to provide global explanations of the model's decision across gait cycles. We evaluate the effectiveness of our method to existing methods at recognizing emotions using both 3D temporal joint signals and manually extracted features. We also show that this data can easily be exploited to expose a subject's identity. Our method shows up to 7% improvement and highlights the joints with the most significant influence across the average gait cycle.
updated: Fri Aug 27 2021 16:16:22 GMT+0000 (UTC)
published: Sun May 09 2021 15:26:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト