arXiv reaDer
スリーパーエージェント:ゼロからトレーニングされたニューラルネットワーク用のスケーラブルな隠しトリガーバックドア
Sleeper Agent: Scalable Hidden Trigger Backdoors for Neural Networks Trained from Scratch
機械学習のためのデータのキュレーションがますます自動化されるにつれて、データセットの改ざんはますます脅威になっています。バックドア攻撃者は、トレーニングデータを改ざんして、そのデータでトレーニングされたモデルに脆弱性を埋め込みます。この脆弱性は、モデルの入力に「トリガー」を配置することにより、推論時にアクティブ化されます。典型的なバックドア攻撃は、トリガーをトレーニングデータに直接挿入しますが、そのような攻撃の存在は検査時に見える場合があります。対照的に、Hidden Trigger Backdoor Attackは、トレーニングデータにトリガーをまったく配置せずに中毒を達成します。ただし、この隠れたトリガー攻撃は、ゼロからトレーニングされたニューラルネットワークを中毒させるのには効果がありません。新しい隠しトリガー攻撃であるSleeperAgentを開発しました。これは、作成プロセス中に勾配マッチング、データ選択、およびターゲットモデルの再トレーニングを採用しています。 Sleeper Agentは、ゼロからトレーニングされたニューラルネットワークに対して効果的な最初の隠れたトリガーバックドア攻撃です。 ImageNetおよびブラックボックス設定でその有効性を示します。実装コードはhttps://github.com/hsouri/Sleeper-Agentにあります。
As the curation of data for machine learning becomes increasingly automated, dataset tampering is a mounting threat. Backdoor attackers tamper with training data to embed a vulnerability in models that are trained on that data. This vulnerability is then activated at inference time by placing a "trigger" into the model's input. Typical backdoor attacks insert the trigger directly into the training data, although the presence of such an attack may be visible upon inspection. In contrast, the Hidden Trigger Backdoor Attack achieves poisoning without placing a trigger into the training data at all. However, this hidden trigger attack is ineffective at poisoning neural networks trained from scratch. We develop a new hidden trigger attack, Sleeper Agent, which employs gradient matching, data selection, and target model re-training during the crafting process. Sleeper Agent is the first hidden trigger backdoor attack to be effective against neural networks trained from scratch. We demonstrate its effectiveness on ImageNet and in black-box settings. Our implementation code can be found at https://github.com/hsouri/Sleeper-Agent.
updated: Thu Oct 13 2022 16:01:36 GMT+0000 (UTC)
published: Wed Jun 16 2021 17:09:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト