arXiv reaDer
隠されたトリガーのバックドア攻撃
Hidden Trigger Backdoor Attacks
 さまざまな分野でのディープラーニングアルゴリズムの成功により、現実世界のアプリケーションでディープモデルを保護するための敵対攻撃の研究が重要な研究トピックになりました。バックドア攻撃は、攻撃者が被害者に有毒なデータを提供してモデルを訓練し、テスト時に特定の小さなトリガーパターンを示すことで攻撃を起動する、深層ネットワークに対する敵対攻撃の一種です。最先端のバックドア攻撃のほとんどは、目視検査で特定できるラベルの誤ったポイズニングデータを提供したり、ポイズニングデータのトリガーを明らかにしたり、ノイズを使用してトリガーを隠したりします。有害なデータが正しいラベルで自然に見える新しい形式のバックドア攻撃を提案します。さらに重要なことは、攻撃者が有害なデータにトリガーを隠し、テスト時までトリガーを秘密にします。さまざまな画像分類設定について広範な調査を実施し、モデルはクリーンなデータでは良好に機能しますが、攻撃は目に見えない画像のランダムな位置にトリガーを貼り付けることでモデルをだますことができることを示しています。また、バックドア攻撃用の最先端の防御アルゴリズムを使用して、提案された攻撃を簡単に防御できないことも示しています。
With the success of deep learning algorithms in various domains, studying adversarial attacks to secure deep models in real world applications has become an important research topic. Backdoor attacks are a form of adversarial attacks on deep networks where the attacker provides poisoned data to the victim to train the model with, and then activates the attack by showing a specific small trigger pattern at the test time. Most state-of-the-art backdoor attacks either provide mislabeled poisoning data that is possible to identify by visual inspection, reveal the trigger in the poisoned data, or use noise to hide the trigger. We propose a novel form of backdoor attack where poisoned data look natural with correct labels and also more importantly, the attacker hides the trigger in the poisoned data and keeps the trigger secret until the test time. We perform an extensive study on various image classification settings and show that our attack can fool the model by pasting the trigger at random locations on unseen images although the model performs well on clean data. We also show that our proposed attack cannot be easily defended using a state-of-the-art defense algorithm for backdoor attacks.
updated: Sat Dec 21 2019 02:13:34 GMT+0000 (UTC)
published: Mon Sep 30 2019 18:03:28 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト