arXiv reaDer
AdvKnn: Adversarial Attacks On K-Nearest Neighbor Classifiers With Approximate Gradients
 ディープニューラルネットワークは、敵対的な例に対して脆弱であることが示されています。悪意を持って作成された例は、知覚できない摂動を追加することでターゲットモデルを誤動作させる可能性があります。 k最近傍〜(kNN)ベースのアルゴリズムの既存の攻撃方法は、大きな摂動を必要とするか、大きなkには適用できません。この問題を処理するために、このペーパーでは、kNNベースのモデルの敵対的堅牢性を評価するためのAdvKNNと呼ばれる新しい方法を提案します。まず、kNNメソッドの出力を近似する深いkNNブロックを提案します。これは微分可能であるため、小さな歪みで決定境界を越える攻撃の勾配を提供できます。第二に、分布に基づく方法の有効性のために、分類の代わりに分布の新しい一貫性学習を提案します。広範な実験結果は、提案された方法が攻撃の成功率と追加された摂動の点で最新技術を大幅に上回ることを示しています。
Deep neural networks have been shown to be vulnerable to adversarial examples---maliciously crafted examples that can trigger the target model to misbehave by adding imperceptible perturbations. Existing attack methods for k-nearest neighbor~(kNN) based algorithms either require large perturbations or are not applicable for large k. To handle this problem, this paper proposes a new method called AdvKNN for evaluating the adversarial robustness of kNN-based models. Firstly, we propose a deep kNN block to approximate the output of kNN methods, which is differentiable thus can provide gradients for attacks to cross the decision boundary with small distortions. Second, a new consistency learning for distribution instead of classification is proposed for the effectiveness in distribution based methods. Extensive experimental results indicate that the proposed method significantly outperforms state of the art in terms of attack success rate and the added perturbations.
updated: Fri Nov 29 2019 11:10:18 GMT+0000 (UTC)
published: Fri Nov 15 2019 12:42:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト