arXiv reaDer
余分なデータのない正確で堅牢なニューラル ネットワークを目指して
Towards Both Accurate and Robust Neural Networks without Extra Data
ディープ ニューラル ネットワークは、さまざまなアプリケーションで優れたパフォーマンスを達成していますが、敵対的摂動に対して非常に脆弱です。敵対的トレーニングやそのバリアントなど、モデルの堅牢性を高めることができる最も代表的で有望な方法は、良性サンプルのモデル精度を大幅に低下させ、実用性を制限します。追加のトレーニング データを組み込むことでトレードオフをある程度緩和できますが、限られたトレーニング データの下でロバスト性と精度の両方を達成することは未解決のままです。ここでは、さまざまなレベルの堅牢性と精度を備えた複数の独立した特徴抽出器を組み合わせた敵対的特徴スタッキング (AFS) モデルを開発することにより、トレードオフを克服する可能性を示します。理論的な分析がさらに行われ、基本的な特徴抽出器を選択するための一般原則が提供されます。 CIFAR-10 および CIFAR-100 データセットで AFS モデルを強力な適応型攻撃方法で評価し、トレードオフの観点から最先端を大幅に前進させます。 AFS モデルは、CIFAR-10 で最大 6%、CIFAR-100 で最大 10% の良性の精度向上を実現し、最先端の敵対的トレーニング方法と同等またはそれ以上の堅牢性を備えています。
Deep neural networks have achieved remarkable performance in various applications but are extremely vulnerable to adversarial perturbation. The most representative and promising methods that can enhance model robustness, such as adversarial training and its variants, substantially degrade model accuracy on benign samples, limiting practical utility. Although incorporating extra training data can alleviate the trade-off to a certain extent, it remains unsolved to achieve both robustness and accuracy under limited training data. Here, we demonstrate the feasibility of overcoming the trade-off, by developing an adversarial feature stacking (AFS) model, which combines multiple independent feature extractors with varied levels of robustness and accuracy. Theoretical analysis is further conducted, and general principles for the selection of basic feature extractors are provided. We evaluate the AFS model on CIFAR-10 and CIFAR-100 datasets with strong adaptive attack methods, significantly advancing the state-of-the-art in terms of the trade-off. The AFS model achieves a benign accuracy improvement of ~6% on CIFAR-10 and ~10% on CIFAR-100 with comparable or even stronger robustness than the state-of-the-art adversarial training methods.
updated: Mon Aug 29 2022 02:37:13 GMT+0000 (UTC)
published: Wed Mar 24 2021 12:01:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト