arXiv reaDer
確率的ターゲットユニバーサル敵対摂動の局所的に最適な検出
Locally optimal detection of stochastic targeted universal adversarial perturbations
深層学習画像分類器は、入力画像の小さな敵対的摂動に対して脆弱であることが知られています。この論文では、分類器入力の確率的ターゲットユニバーサル敵対摂動(UAP)を検出するための局所的に最適な一般化尤度比検定(LO-GLRT)ベースの検出器を導出します。また、検出器のパラメータを学習するための教師ありトレーニング方法について説明し、いくつかの一般的な画像分類データセットで他の検出方法と比較して検出器のパフォーマンスが優れていることを示します。
Deep learning image classifiers are known to be vulnerable to small adversarial perturbations of input images. In this paper, we derive the locally optimal generalized likelihood ratio test (LO-GLRT) based detector for detecting stochastic targeted universal adversarial perturbations (UAPs) of the classifier inputs. We also describe a supervised training method to learn the detector's parameters, and demonstrate better performance of the detector compared to other detection methods on several popular image classification datasets.
updated: Tue Dec 08 2020 19:27:39 GMT+0000 (UTC)
published: Tue Dec 08 2020 19:27:39 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト