敵対的堅牢性の研究は、これまでのところ、pノルムで束縛された摂動に主に焦点を当ててきました。ただし、最先端のモデルは、平行移動や回転などの他のより自然な種類の摂動に対しても脆弱であることが判明しています。この作業では、ニューラルネットワークベースの分類子の回転と変換に対する脆弱性を徹底的に調査します。データ増強は比較的小さなロバストネスを提供しますが、ロバスト性を大幅に改善するために、ロバストな最適化とテスト時の入力集計からのアイデアを使用します。最後に、pノルムの場合とは対照的に、1次の方法では最悪の場合の摂動を確実に見つけることができないことがわかります。これは、追加の調査を必要とする根本的に異なる設定としての空間的堅牢性を強調しています。 https://github.com/MadryLab/adversarial_spatialおよびhttps://github.com/MadryLab/spatial-pytorchで利用可能なコード。
The study of adversarial robustness has so far largely focused on perturbations bound in p-norms. However, state-of-the-art models turn out to be also vulnerable to other, more natural classes of perturbations such as translations and rotations. In this work, we thoroughly investigate the vulnerability of neural network--based classifiers to rotations and translations. While data augmentation offers relatively small robustness, we use ideas from robust optimization and test-time input aggregation to significantly improve robustness. Finally we find that, in contrast to the p-norm case, first-order methods cannot reliably find worst-case perturbations. This highlights spatial robustness as a fundamentally different setting requiring additional study. Code available at https://github.com/MadryLab/adversarial_spatial and https://github.com/MadryLab/spatial-pytorch.