arXiv reaDer
視覚的感情分布学習における主観性の追求
Seeking Subjectivity in Visual Emotion Distribution Learning
さまざまな視覚刺激に対する人々の感情を予測することを目的とした視覚感情分析(VEA)は、最近魅力的な研究トピックになっています。単一のラベル分類タスクではなく、さまざまな個人から投票することにより、VEAをラベル配布学習(LDL)の問題と見なす方が合理的です。既存の方法は、多くの場合、群衆の投票プロセスに固有の主観性を無視して、統一されたネットワーク内の視覚的な感情の分布を予測します。心理学では、オブジェクト-評価-感情モデルは、各個人の感情が感情的な記憶によってさらに形成される彼/彼女の主観的な評価によって影響を受けることを示しました。これに触発されて、視覚的感情分布の主観性を調査するための新しい主観性評価および一致ネットワーク(SAMNet)を提案します。群衆の投票プロセスの多様性を表現するために、最初に複数のブランチを使用した主観性評価を提案します。各ブランチは、特定の個人の感情喚起プロセスをシミュレートします。具体的には、注意に基づくメカニズムを使用して感情的な記憶を構築し、各個人の固有の感情的な経験を保持します。主観性の喪失は、異なる個人間の相違を保証するためにさらに提案されます。さらに、ハンガリーのアルゴリズムと1対1で対応して、順序付けられた個々の予測に順序付けられていない感情ラベルを割り当てることを目的として、マッチング損失を伴う主観的マッチングを提案します。広範な実験と比較が公共の視覚的感情分布データセットで行われ、その結果は、提案されたSAMNetが常に最先端の方法を上回っていることを示しています。アブレーション研究は私たちの方法の有効性を検証し、視覚化はその解釈可能性を証明します。
Visual Emotion Analysis (VEA), which aims to predict people's emotions towards different visual stimuli, has become an attractive research topic recently. Rather than a single label classification task, it is more rational to regard VEA as a Label Distribution Learning (LDL) problem by voting from different individuals. Existing methods often predict visual emotion distribution in a unified network, neglecting the inherent subjectivity in its crowd voting process. In psychology, the Object-Appraisal-Emotion model has demonstrated that each individual's emotion is affected by his/her subjective appraisal, which is further formed by the affective memory. Inspired by this, we propose a novel Subjectivity Appraise-and-Match Network (SAMNet) to investigate the subjectivity in visual emotion distribution. To depict the diversity in crowd voting process, we first propose the Subjectivity Appraising with multiple branches, where each branch simulates the emotion evocation process of a specific individual. Specifically, we construct the affective memory with an attention-based mechanism to preserve each individual's unique emotional experience. A subjectivity loss is further proposed to guarantee the divergence between different individuals. Moreover, we propose the Subjectivity Matching with a matching loss, aiming at assigning unordered emotion labels to ordered individual predictions in a one-to-one correspondence with the Hungarian algorithm. Extensive experiments and comparisons are conducted on public visual emotion distribution datasets, and the results demonstrate that the proposed SAMNet consistently outperforms the state-of-the-art methods. Ablation study verifies the effectiveness of our method and visualization proves its interpretability.
updated: Mon Jul 25 2022 02:20:03 GMT+0000 (UTC)
published: Mon Jul 25 2022 02:20:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト