arXiv reaDer
ローカルフラットネス正則化による敵対的防御
Adversarial Defense via Local Flatness Regularization
 敵対的防御は人気があり、重要な研究分野です。その固有のメカニズムにより、攻撃を防御する最も簡単で効果的な方法の1つは、入力空間の損失面の特性を分析することです。この論文では、損失面の局所平坦度を、良性サンプルを中心とした近傍内の入力に関する勾配の選択したノルムの最大値として定義し、局所平坦度と敵対的脆弱性との関係について説明します。分析に基づいて、局所的な平坦度を正則化することによる新しい防御アプローチを提案し、局所的平坦度正則化(LFR)と呼びます。また、人間の視覚メカニズムなど、他の視点からの提案手法の有効性を示し、LFRと他の関連手法との関係を理論的に分析します。私たちの理論を検証し、提案された方法の優位性を実証するために実験が行われます。
Adversarial defense is a popular and important research area. Due to its intrinsic mechanism, one of the most straightforward and effective ways of defending attacks is to analyze the property of loss surface in the input space. In this paper, we define the local flatness of the loss surface as the maximum value of the chosen norm of the gradient regarding to the input within a neighborhood centered on the benign sample, and discuss the relationship between the local flatness and adversarial vulnerability. Based on the analysis, we propose a novel defense approach via regularizing the local flatness, dubbed local flatness regularization (LFR). We also demonstrate the effectiveness of the proposed method from other perspectives, such as human visual mechanism, and analyze the relationship between LFR and other related methods theoretically. Experiments are conducted to verify our theory and demonstrate the superiority of the proposed method.
updated: Thu Dec 17 2020 07:19:03 GMT+0000 (UTC)
published: Sun Oct 27 2019 02:12:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト