arXiv reaDer
ベイジアン攻撃による敵対的な例の転送可能性の向上
Improving Transferability of Adversarial Examples via Bayesian Attacks
この論文は、ICLR で発表された私たちの研究の大幅な拡張を示しています。私たちの ICLR の研究では、モデル パラメーターにベイズ定式化を組み込むことで、敵対的な例での伝達可能性を高めることを提唱しました。これは、無限に多くのディープ ニューラル ネットワークのアンサンブルを効果的にエミュレートします。一方、この論文では、ベイズ定式化をモデル入力にも組み込むことで、モデル入力とモデル パラメーターの両方の共同多様化を可能にする新しい拡張機能を導入します。私たちの経験的発見は次のことを示しています。1) モデル入力とモデルパラメーターの両方に対するベイズ定式化の組み合わせにより、伝達可能性が大幅に向上します。 2) モデル入力に対する事後分布の高度な近似を導入することにより、敵対的伝達性がさらに強化され、モデルの微調整なしで攻撃する場合のすべての最先端技術を上回ります。さらに、このような拡張ベイズ定式化におけるモデルパラメータを微調整するための原理的なアプローチを提案します。導出された最適化目標は本質的に、パラメーター空間と入力空間での平坦な最小値を促進します。広範な実験により、私たちの手法が転送ベースの攻撃に関して新しい最先端を達成し、ICLR 基本ベイジアン手法と比較した場合、ImageNet と CIFAR-10 での平均成功率がそれぞれ 19.14% と 2.08% 向上することが実証されました。コードを公開します。
This paper presents a substantial extension of our work published at ICLR. Our ICLR work advocated for enhancing transferability in adversarial examples by incorporating a Bayesian formulation into model parameters, which effectively emulates the ensemble of infinitely many deep neural networks, while, in this paper, we introduce a novel extension by incorporating the Bayesian formulation into the model input as well, enabling the joint diversification of both the model input and model parameters. Our empirical findings demonstrate that: 1) the combination of Bayesian formulations for both the model input and model parameters yields significant improvements in transferability; 2) by introducing advanced approximations of the posterior distribution over the model input, adversarial transferability achieves further enhancement, surpassing all state-of-the-arts when attacking without model fine-tuning. Moreover, we propose a principled approach to fine-tune model parameters in such an extended Bayesian formulation. The derived optimization objective inherently encourages flat minima in the parameter space and input space. Extensive experiments demonstrate that our method achieves a new state-of-the-art on transfer-based attacks, improving the average success rate on ImageNet and CIFAR-10 by 19.14% and 2.08%, respectively, when comparing with our ICLR basic Bayesian method. We will make our code publicly available.
updated: Fri Jul 21 2023 03:43:07 GMT+0000 (UTC)
published: Fri Jul 21 2023 03:43:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト