ソーシャルメディアプラットフォームの人気が高まるにつれ、ヘイトスピーチが主要な懸念事項として浮上しており、性別、宗教、民族などの特定のグループの特性を対象とした虐待的なスピーチを表現し、暴力を広めています。以前は口頭でヘイトスピーチを行っていましたが、テクノロジーの普及に伴い、ソーシャルメディアプラットフォームを使用して、投稿、共有、コメントなどで憎悪を広める人もいます。クライストチャーチモスクの銃撃であろうと、西部のアジア人に対するヘイトクライムであろうと、有罪判決者は、オンラインに存在するヘイトスピーチの影響を非常に受けていることが観察されています。 AIシステムはそのようなテキストにフラグを立てるために設置されていますが、重要な課題の1つは、偽陽性率を減らして(非憎悪を憎悪としてマークする)、これらのシステムが表現の自由を損なうことなくヘイトスピーチを検出できるようにすることです。このホワイトペーパーでは、ETHOSヘイトスピーチ検出データセットを使用し、単語の埋め込み(fastText(FT)、GloVe(GV)、またはFT + GV)を静的BERT埋め込み(BE)に置き換えるか統合することにより、ヘイトスピーチ検出分類子のパフォーマンスを分析します。広範な実験の軌跡により、FT、GV、またはFT + GVを単語の埋め込みとして使用する場合と比較して、静的BEを使用した方がニューラルネットワークのパフォーマンスが向上することが観察されています。微調整されたBERTと比較して、大幅に改善された1つのメトリックは特異性です。
With increasing popularity of social media platforms hate speech is emerging as a major concern, where it expresses abusive speech that targets specific group characteristics, such as gender, religion or ethnicity to spread violence. Earlier people use to verbally deliver hate speeches but now with the expansion of technology, some people are deliberately using social media platforms to spread hate by posting, sharing, commenting, etc. Whether it is Christchurch mosque shootings or hate crimes against Asians in west, it has been observed that the convicts are very much influenced from hate text present online. Even though AI systems are in place to flag such text but one of the key challenges is to reduce the false positive rate (marking non hate as hate), so that these systems can detect hate speech without undermining the freedom of expression. In this paper, we use ETHOS hate speech detection dataset and analyze the performance of hate speech detection classifier by replacing or integrating the word embeddings (fastText (FT), GloVe (GV) or FT + GV) with static BERT embeddings (BE). With the extensive experimental trails it is observed that the neural network performed better with static BE compared to using FT, GV or FT + GV as word embeddings. In comparison to fine-tuned BERT, one metric that significantly improved is specificity.