arXiv reaDer
Defending Against Neural Fake News
自然言語生成の最近の進歩により、二重使用の懸念が生じています。要約や翻訳などのアプリケーションは肯定的ですが、基盤となる技術により、敵はニューラル偽のニュースを生成できる可能性があります。つまり、実際のニュースのスタイルによく似た標的型プロパガンダです。現代のコンピュータセキュリティは、慎重な脅威モデリングに依存しています。潜在的な脅威と脆弱性を敵の観点から特定し、これらの脅威に対する潜在的な緩和策を探ります。同様に、ニューラルフェイクニュースに対する堅牢な防御を開発するには、まずこれらのモデルのリスクを慎重に調査し、特性評価する必要があります。したがって、グローバーと呼ばれる制御可能なテキスト生成のモデルを提示します。 「リンクはワクチンと自閉症の間に見つかりました」のような見出しを考えると、グローバーは記事の残りを生成することができます。人間は、これらの世代が人間が書いた偽情報よりも信頼できると感じています。 Groverのような発電機に対する堅牢な検証技術を開発することは重要です。中程度のレベルのトレーニングデータへのアクセスを前提として、現在の最高の弁別者は、本物の人間が書いたニュースから神経偽のニュースを73%の精度で分類できることがわかります。直感に反して、Groverに対する最善の防御は、Grover自体であり、92%の精度であることが判明し、強力な発電機の一般公開の重要性を示しています。これらの結果をさらに調査し、曝露バイアスとその影響を軽減するサンプリング戦略の両方が、同様の弁別者が拾い上げることができるアーティファクトを残すことを示しています。最後に、テクノロジーに関する倫理的問題について議論し、Groverを一般公開する計画を立て、ニューラルフェイクニュースのより良い検出への道を開きます。
Recent progress in natural language generation has raised dual-use concerns. While applications like summarization and translation are positive, the underlying technology also might enable adversaries to generate neural fake news: targeted propaganda that closely mimics the style of real news. Modern computer security relies on careful threat modeling: identifying potential threats and vulnerabilities from an adversary's point of view, and exploring potential mitigations to these threats. Likewise, developing robust defenses against neural fake news requires us first to carefully investigate and characterize the risks of these models. We thus present a model for controllable text generation called Grover. Given a headline like `Link Found Between Vaccines and Autism,' Grover can generate the rest of the article; humans find these generations to be more trustworthy than human-written disinformation. Developing robust verification techniques against generators like Grover is critical. We find that best current discriminators can classify neural fake news from real, human-written, news with 73% accuracy, assuming access to a moderate level of training data. Counterintuitively, the best defense against Grover turns out to be Grover itself, with 92% accuracy, demonstrating the importance of public release of strong generators. We investigate these results further, showing that exposure bias -- and sampling strategies that alleviate its effects -- both leave artifacts that similar discriminators can pick up on. We conclude by discussing ethical issues regarding the technology, and plan to release Grover publicly, helping pave the way for better detection of neural fake news.
updated: Tue Oct 29 2019 21:37:14 GMT+0000 (UTC)
published: Wed May 29 2019 17:58:52 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト