arXiv reaDer
敵対者の例の転送可能性を詳しく見る: 異なるモデルを異なる方法でだます方法
Closer Look at the Transferability of Adversarial Examples: How They Fool Different Models Differently
ディープ ニューラル ネットワークは、敵対的な伝達性を持つ敵対的な例 (AE) に対して脆弱です。ソース モデルに対して生成された AE は、別の (ターゲット) モデルの予測を誤解させる可能性があります。しかし、どのクラスのターゲットモデルの予測が誤った方向に導かれたかという観点からの転送可能性 (つまり、クラスアウェアな転送可能性) は理解されていません。このホワイト ペーパーでは、ターゲット モデルがソース モデルと同じ間違ったクラスを予測する場合 (「同じミス」) と別の間違ったクラスを予測する場合 (「異なるミス」) を区別して分析し、そのメカニズムを説明します。まず、私たちの分析は、(1) AE は「対象外の伝達可能性」と相関して同じ間違いを引き起こす傾向があること、および (2) 摂動の大きさに関係なく、類似のモデル間で異なる間違いが発生することを示しています。第二に、同じミスと異なるミスの違いは、ロバストではない機能、予測可能だが人間には解釈できないパターンによって説明できるという証拠を提示します。したがって、堅牢でない機能は、AE のクラス認識転送可能性について一貫した説明を提供できます。
Deep neural networks are vulnerable to adversarial examples (AEs), which have adversarial transferability: AEs generated for the source model can mislead another (target) model's predictions. However, the transferability has not been understood from the perspective of to which class target model's predictions were misled (i.e., class-aware transferability). In this paper, we differentiate the cases in which a target model predicts the same wrong class as the source model ("same mistake") or a different wrong class ("different mistake") to analyze and provide an explanation of the mechanism. First, our analysis shows (1) that AEs tend to cause same mistakes, correlating with "non-targeted transferability," and (2) that different mistakes occur between similar models regardless of the perturbation size. Second, we present evidence that the difference in same mistakes and different mistakes can be explained by non-robust features, predictive but human-uninterpretable patterns: different mistakes occur when non-robust features in AEs are used differently by models. Non-robust features can thus provide consistent explanations for the class-aware transferability of AEs.
updated: Wed Oct 12 2022 19:54:30 GMT+0000 (UTC)
published: Wed Dec 29 2021 00:18:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト