arXiv reaDer
ダンクかどうか? --Redditでのミームの人気の分析と予測
Dank or Not? -- Analyzing and Predicting the Popularity of Memes on Reddit
インターネットミームは、最近ますます普及している現代の社会的コミュニケーションの形態になり、最近多くの研究の関心を集めています。この論文では、最も深刻なコロナウイルス制限が世界中で導入されていた2020年3月中旬にRedditから収集された129,326ミームのデータを分析します。この記事では、COVID-19のパンデミック時のインターネットユーザーの考えを詳しく説明するだけでなく、ミームが口コミで広まる原因についてコンテンツベースの予測分析を行います。機械学習手法を使用して、ミームの人気に関するテキスト属性よりも増分予測力画像関連属性がどのようなものであるかも調査します。ミームの成功は、その内容だけに基づいて適度に予測できることがわかりました。最高のパフォーマンスを発揮する機械学習モデルは、AUC = 0.68でウイルスミームを予測します。また、画像関連の属性とテキスト属性の両方が、相互に有意な増分予測力を持っていることもわかりました。
Internet memes have become an increasingly pervasive form of contemporary social communication that attracted a lot of research interest recently. In this paper, we analyze the data of 129,326 memes collected from Reddit in the middle of March, 2020, when the most serious coronavirus restrictions were being introduced around the world. This article not only provides a looking glass into the thoughts of Internet users during the COVID-19 pandemic but we also perform a content-based predictive analysis of what makes a meme go viral. Using machine learning methods, we also study what incremental predictive power image related attributes have over textual attributes on meme popularity. We find that the success of a meme can be predicted based on its content alone moderately well, our best performing machine learning model predicts viral memes with AUC=0.68. We also find that both image related and textual attributes have significant incremental predictive power over each other.
updated: Fri Jan 22 2021 08:31:42 GMT+0000 (UTC)
published: Sun Nov 29 2020 09:57:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト