敵対的な攻撃と防御は、現在、ディープラーニングコミュニティの活発な研究分野です。最近のレビューペーパーでは、防衛アプローチを3つのカテゴリに分けました。勾配マスキング、ロバストな最適化、および敵対者の検出。グラディエントマスキングとロバスト最適化を別々に分割します:(1)特徴ベクトルのクラス内コンパクト性とクラス間分離の増加は、敵対的堅牢性を向上させ、(2)非堅牢な画像特徴の周辺化または除去も敵対的堅牢性を向上させます。これらのトピックを異なる方法で再構成することにより、より堅牢なネットワークのトレーニングを可能にし、斬新なソリューションのインスピレーションをもたらす基礎となる要因に対する洞察を提供する新鮮な視点を提供します。さらに、敵対的防御の文献には、敵対的堅牢性のコスト、または堅牢性と精度のトレードオフがあると主張する論文がいくつかありますが、この提案された分類法では、これは普遍的ではないという仮説を立てています。この論文のつながりと洞察に基づいた深層学習研究コミュニティへのいくつかの挑戦で、分類法をフォローアップします。
Adversarial attacks and defenses are currently active areas of research for the deep learning community. A recent review paper divided the defense approaches into three categories; gradient masking, robust optimization, and adversarial example detection. We divide gradient masking and robust optimization differently: (1) increasing intra-class compactness and inter-class separation of the feature vectors improves adversarial robustness, and (2) marginalization or removal of non-robust image features also improves adversarial robustness. By reframing these topics differently, we provide a fresh perspective that provides insight into the underlying factors that enable training more robust networks and can help inspire novel solutions. In addition, there are several papers in the literature of adversarial defenses that claim there is a cost for adversarial robustness, or a trade-off between robustness and accuracy but, under this proposed taxonomy, we hypothesis that this is not universal. We follow up on our taxonomy with several challenges to the deep learning research community that builds on the connections and insights in this paper.