arXiv reaDer
人間のようなテキスト処理:NLPシステムを視覚的に攻撃して保護する
Text Processing Like Humans Do: Visually Attacking and Shielding NLP Systems
テキストへの視覚的な変更は、他のシナリオの中でも、ソーシャルメディアでの不快なコメントの難読化(「!d10t」など)やライティングスタイル(「リートスピーク」の「1337」)としてよく使用されます。私たちはこれをNLPの新しいタイプの敵対的攻撃と見なします。これは、単純な視覚入力摂動とより困難な視覚入力摂動の両方の実験が示すように、人間が非常に堅牢な設定です。次に、現在のNLPシステムに対する視覚的攻撃の文字、単語、および文レベルのタスクへの影響を調査し、人間とは対照的に、神経モデルと非神経モデルの両方がそのような攻撃に非常に敏感であり、パフォーマンスが低下していることを示します最大82%の減少。次に、モデルの堅牢性を大幅に向上させる3つのシールド方法(視覚的な文字の埋め込み、敵対的なトレーニング、およびルールベースの回復)について検討します。ただし、シールド方法は、非攻撃シナリオで達成されるパフォーマンスよりも依然として遅れており、視覚的な攻撃への対処が困難であることを示しています。
Visual modifications to text are often used to obfuscate offensive comments in social media (e.g., "!d10t") or as a writing style ("1337" in "leet speak"), among other scenarios. We consider this as a new type of adversarial attack in NLP, a setting to which humans are very robust, as our experiments with both simple and more difficult visual input perturbations demonstrate. We then investigate the impact of visual adversarial attacks on current NLP systems on character-, word-, and sentence-level tasks, showing that both neural and non-neural models are, in contrast to humans, extremely sensitive to such attacks, suffering performance decreases of up to 82%. We then explore three shielding methods---visual character embeddings, adversarial training, and rule-based recovery---which substantially improve the robustness of the models. However, the shielding methods still fall behind performances achieved in non-attack scenarios, which demonstrates the difficulty of dealing with visual attacks.
updated: Wed Jun 10 2020 12:20:04 GMT+0000 (UTC)
published: Wed Mar 27 2019 16:01:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト