arXiv reaDer
表現学習のための視覚的関与信号の調査
Exploring Visual Engagement Signals for Representation Learning
ソーシャルメディアプラットフォームでのビジュアルエンゲージメントは、コメント、共有、いいねなどの写真投稿とのやり取りで構成されます。この論文では、表現学習のための監督信号などの視覚的関与の手がかりを活用します。ただし、エンゲージメントシグナルから学ぶことは、低レベルの視覚情報と高レベルの社会的相互作用の間のギャップを埋める方法が明確でないため、重要です。弱く教師あり学習アプローチであるVisEを紹介します。これは、ソーシャルイメージをクラスター化されたエンゲージメントシグナルによって導出された疑似ラベルにマッピングします。次に、このようにトレーニングされたモデルが、感情認識や政治的バイアス検出などの主観的なダウンストリームコンピュータービジョンタスクにどのように役立つかを研究します。広範な研究を通じて、従来の認識の範囲を超えた分類タスクの多様なセット全体でVisEの有効性を経験的に示しています。
Visual engagement in social media platforms comprises interactions with photo posts including comments, shares, and likes. In this paper, we leverage such visual engagement clues as supervisory signals for representation learning. However, learning from engagement signals is non-trivial as it is not clear how to bridge the gap between low-level visual information and high-level social interactions. We present VisE, a weakly supervised learning approach, which maps social images to pseudo labels derived by clustered engagement signals. We then study how models trained in this way benefit subjective downstream computer vision tasks such as emotion recognition or political bias detection. Through extensive studies, we empirically demonstrate the effectiveness of VisE across a diverse set of classification tasks beyond the scope of conventional recognition.
updated: Thu Apr 15 2021 20:50:40 GMT+0000 (UTC)
published: Thu Apr 15 2021 20:50:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト