arXiv reaDer
ラベル-スムーズなバックドア攻撃
Label-Smoothed Backdoor Attack
少数の汚染されたサンプルをトレーニングセットに注入することにより、バックドア攻撃は、被害者モデルが事前に設計されたバックドアで注入された入力に対して設計された出力を生成することを目的としています。毒のあるトレーニングサンプルをできるだけ少なくして高い攻撃成功率を達成するために、ほとんどの既存の攻撃方法は、毒のあるサンプルのラベルをターゲットクラスに変更します。この方法では、多くの場合、バックドアに対する被害者モデルの過剰適合が発生し、攻撃は出力制御に非常に効果的ですが、人間による検査や自動防御アルゴリズムによって簡単に識別できます。この作業では、これらの攻撃方法の過剰適合問題を克服するためのラベル平滑化戦略を提案し、ラベル平滑化バックドア攻撃(LSBA)を取得しました。 LSBAでは、被毒サンプルxのラベルが100%ではなくp_n(x)の確率でターゲットクラスに変更され、p_n(x)の値は、予測確率をターゲットクラスにするように特別に設計されています。他のクラスのものよりわずかに大きいだけです。いくつかの既存のバックドア攻撃に関する経験的研究は、私たちの戦略がこれらの攻撃のステルス性を大幅に改善し、同時に高い攻撃成功率を達成できることを示しています。さらに、私たちの戦略では、適用およびアクティブ化された数のLSBAsを操作することにより、設計出力の予測確率を手動で制御できます。ソースコードはhttps://github.com/v-mipeng/LabelSmoothedAttack.gitで公開されます。
By injecting a small number of poisoned samples into the training set, backdoor attacks aim to make the victim model produce designed outputs on any input injected with pre-designed backdoors. In order to achieve a high attack success rate using as few poisoned training samples as possible, most existing attack methods change the labels of the poisoned samples to the target class. This practice often results in severe over-fitting of the victim model over the backdoors, making the attack quite effective in output control but easier to be identified by human inspection or automatic defense algorithms. In this work, we proposed a label-smoothing strategy to overcome the over-fitting problem of these attack methods, obtaining a Label-Smoothed Backdoor Attack (LSBA). In the LSBA, the label of the poisoned sample x will be changed to the target class with a probability of p_n(x) instead of 100%, and the value of p_n(x) is specifically designed to make the prediction probability the target class be only slightly greater than those of the other classes. Empirical studies on several existing backdoor attacks show that our strategy can considerably improve the stealthiness of these attacks and, at the same time, achieve a high attack success rate. In addition, our strategy makes it able to manually control the prediction probability of the design output through manipulating the applied and activated number of LSBAsSource code will be published at https://github.com/v-mipeng/LabelSmoothedAttack.git.
updated: Sat Feb 19 2022 01:31:41 GMT+0000 (UTC)
published: Sat Feb 19 2022 01:31:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト