arXiv reaDer
成功とシンプルさについて:転送可能な標的型攻撃の再検討
On Success and Simplicity: A Second Look at Transferable Targeted Attacks
敵対的な例を研究している研究者の間には、転送可能な標的型攻撃を達成することは非常に難しいという幅広いコンセンサスがあります。現在、既存の研究は、複雑な損失や大規模なトレーニングにさえ頼ることによって、転送可能な標的型攻撃を目指しています。このホワイトペーパーでは、転送可能な標的型攻撃を再検討し、従来の評価手順の死角のためにその難易度が過大評価されていることを示します。具体的には、現在の作業では、攻撃の最適化が数回の反復に不当に制限されています。ここでは、標的型攻撃がゆっくりと収束して最適な転送可能性になり、反復回数を増やすと大幅に改善されることを示します。また、ターゲットのロジットを単純に最大化する攻撃が驚くほどうまく機能し、より複雑な損失を大幅に上回り、高度な複数期間の損失を伴う大規模なトレーニングを必要とする最先端のパフォーマンスに匹敵するパフォーマンスを達成することも示しています。現実的なアンサンブル設定とGoogleCloud Vision APIに対する実際の攻撃で、ロジット攻撃のさらなる検証を提供します。ロジット攻撃は、ターゲットのセマンティクスを反映する摂動を生成します。これにより、追加のトレーニング画像なしで、ターゲットを絞った普遍的な敵対的摂動を作成できます。
There is broad consensus among researchers studying adversarial examples that it is extremely difficult to achieve transferable targeted attacks. Currently, existing research strives for transferable targeted attacks by resorting to complex losses and even massive training. In this paper, we take a second look at transferable targeted attacks and show that their difficulty has been overestimated due to a blind spot in the conventional evaluation procedures. Specifically, current work has unreasonably restricted attack optimization to a few iterations. Here, we show that targeted attacks converge slowly to optimal transferability and improve considerably when given more iterations. We also demonstrate that an attack that simply maximizes the target logit performs surprisingly well, remarkably surpassing more complex losses and even achieving performance comparable to the state of the art, which requires massive training with a sophisticated multi-term loss. We provide further validation of our logit attack in a realistic ensemble setting and in a real-world attack against the Google Cloud Vision API. The logit attack produces perturbations that reflect the target semantics, which we demonstrate allows us to create targeted universal adversarial perturbations without additional training images.
updated: Sat Feb 06 2021 15:18:35 GMT+0000 (UTC)
published: Mon Dec 21 2020 09:41:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト