arXiv reaDer
A principled approach for generating adversarial images under non-smooth dissimilarity metrics
  ディープニューラルネットワークは、実世界のデータでは良好に機能しますが、敵対的な摂動を起こしやすい傾向があります。入力の小さな変化は、誤分類につながりやすくなります。この作業では、摂動が$ \ ell_p $ノルムによって測定される場合だけでなく、実際には、閉じた近接形態での敵対的非類似性メトリックの攻撃方法を提案します。これには、$ \ ell_1、\ ell_2 $、および$ \ ell_ \ infty $の摂動が含まれますが、これらに限定されません。 「ノルム」をカウントする$ \ ell_0 $(つまり、真のスパース性);合計変動セミノルム。これは、ローカルピクセルの変化を測定する(非$ \ ell_p $)畳み込み非類似度です。私たちのアプローチは、最近の攻撃手法の自然な拡張であり、メトリックの微分可能性の要件を排除します。 MNIST、CIFAR10、およびImageNet-1kデータセットでアルゴリズムProxLogBarrierをデモします。防御されていないモデルと防御されているモデルを検討し、アルゴリズムがさまざまなデータセットに簡単に移行できることを示します。 ProxLogBarrierは、$ \ ell_0 $ケースに特化した多くの現代の敵対攻撃よりも優れていることがわかります。さらに、全変動セミノルムの画像を変更することにより、隣接するピクセル情報を活用する新しいクラスの摂動に光を当てました。
Deep neural networks perform well on real world data but are prone to adversarial perturbations: small changes in the input easily lead to misclassification. In this work, we propose an attack methodology not only for cases where the perturbations are measured by $\ell_p$ norms, but in fact any adversarial dissimilarity metric with a closed proximal form. This includes, but is not limited to, $\ell_1, \ell_2$, and $\ell_\infty$ perturbations; the $\ell_0$ counting "norm" (i.e. true sparseness); and the total variation seminorm, which is a (non-$\ell_p$) convolutional dissimilarity measuring local pixel changes. Our approach is a natural extension of a recent adversarial attack method, and eliminates the differentiability requirement of the metric. We demonstrate our algorithm, ProxLogBarrier, on the MNIST, CIFAR10, and ImageNet-1k datasets. We consider undefended and defended models, and show that our algorithm easily transfers to various datasets. We observe that ProxLogBarrier outperforms a host of modern adversarial attacks specialized for the $\ell_0$ case. Moreover, by altering images in the total variation seminorm, we shed light on a new class of perturbations that exploit neighboring pixel information.
updated: Tue Oct 08 2019 17:21:21 GMT+0000 (UTC)
published: Mon Aug 05 2019 14:57:01 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト