大規模なデータセットが不足しているため、視覚感情分析で一般的なアプローチは、ImageNetなどの大規模なデータセットでオブジェクト分類のために訓練されたモデルを活用することです。ただし、オブジェクトは感情ニュートラルであり、そのようなタスクの転送学習の期待されるゲインを妨げます。この作業では、後続の視覚感情分析により適した新しい感情に合わせた画像埋め込みを学習することにより、この問題を克服することを提案します。埋め込みでは、ソーシャルメディアから大規模で容易に入手可能なデータの絵文字と画像の複雑な関係を活用します。絵文字は言語に依存せず、一貫性があり、明確な感情信号を伝達するため、感情に沿った埋め込みを学習するための優れたプロキシになります。したがって、Twitterから収集された400万枚の画像とそれに関連する絵文字の新しいデータセットを構築します。絵文字予測タスクをプロキシとして使用して、画像埋め込み用のディープニューラルモデルをトレーニングします。私たちの評価は、提案された埋め込みが、いくつかのセンチメント分析ベンチマークで一貫して人気のあるオブジェクトベースの対応物よりも優れていることを示しています。さらに、コンパクトで効果的でシンプルな埋め込みは、これらのパブリックベンチマークでより複雑でカスタマイズされた最新のディープモデルよりも優れています。さらに、視覚的な感情的反応に基づいた新しい絵文字表現を導入します。これにより、絵文字のモダリティとソーシャルメディアでのその使用法についての理解が深まります。
Due to the lack of large-scale datasets, the prevailing approach in visual sentiment analysis is to leverage models trained for object classification in large datasets like ImageNet. However, objects are sentiment neutral which hinders the expected gain of transfer learning for such tasks. In this work, we propose to overcome this problem by learning a novel sentiment-aligned image embedding that is better suited for subsequent visual sentiment analysis. Our embedding leverages the intricate relation between emojis and images in large-scale and readily available data from social media. Emojis are language-agnostic, consistent, and carry a clear sentiment signal which make them an excellent proxy to learn a sentiment aligned embedding. Hence, we construct a novel dataset of 4 million images collected from Twitter with their associated emojis. We train a deep neural model for image embedding using emoji prediction task as a proxy. Our evaluation demonstrates that the proposed embedding outperforms the popular object-based counterpart consistently across several sentiment analysis benchmarks. Furthermore, without bell and whistles, our compact, effective and simple embedding outperforms the more elaborate and customized state-of-the-art deep models on these public benchmarks. Additionally, we introduce a novel emoji representation based on their visual emotional response which supports a deeper understanding of the emoji modality and their usage on social media.