このペーパーは、敵対的攻撃に対する深いモデルの防御に関係しています。証明書の防御アプローチに着想を得て、ディープネットワークをロバスト化するための最大敵対歪み(MAD)最適化手法を提案します。 MADは、小さな歪みに対するネットワークの感度を低下させながら、埋め込み空間でのクラスクラスターの分離可能性を向上させるという考え方を取り入れています。分類問題のディープニューラルネットワーク(DNN)がある場合、MAD最適化を適用すると、元のネットワークのバージョンであるMadNetが生成され、現在は敵対的な防御メカニズムが装備されています。 MADの最適化は直感的で効果的でスケーラブルであり、その結果、MadNetは元の精度を向上させることができます。 MadNetが最新の方法と比較して敵対的な堅牢性のパフォーマンスを向上させることを示す広範な実証的研究を提示します。
This paper is concerned with the defense of deep models against adversarial attacks. Inspired by the certificate defense approach, we propose a maximal adversarial distortion (MAD) optimization method for robustifying deep networks. MAD captures the idea of increasing separability of class clusters in the embedding space while decreasing the network sensitivity to small distortions. Given a deep neural network (DNN) for a classification problem, an application of MAD optimization results in MadNet, a version of the original network, now equipped with an adversarial defense mechanism. MAD optimization is intuitive, effective and scalable, and the resulting MadNet can improve the original accuracy. We present an extensive empirical study demonstrating that MadNet improves adversarial robustness performance compared to state-of-the-art methods.