arXiv reaDer
刺激の持続によるロバストな学習
Robust Learning via Persistency of Excitation
ニューラル ネットワークの敵対的堅牢性を改善することは、依然として大きな課題です。基本的に、ネットワークのトレーニングはパラメーター推定の問題です。適応制御理論では、励振の持続性 (PoE) を維持することは、動的システムのパラメーター推定値をロバスト最適値に確実に収束させるために不可欠です。この作業では、勾配降下法を使用したネットワーク トレーニングが、動的システム パラメーター推定問題に相当することを示します。この関係を利用して、学習率が損失関数の勾配のリプシッツ定数の逆数よりも小さい場合に、勾配降下の PoE の十分条件が達成されることを証明します。極値理論を使用して対応するリプシッツ定数を推定するための効率的な手法を提供し、学習率スケジュールをスケーリングするだけで、ベンチマーク データセットで敵対的精度を最大 15% 向上できることを示します。また、私たちのアプローチは、AutoAttack ベンチマークで敵対的に訓練されたさまざまな最先端のモデルで、敵対的精度を 0.1% から 0.3% ポイント向上させます。
Improving adversarial robustness of neural networks remains a major challenge. Fundamentally, training a network is a parameter estimation problem. In adaptive control theory, maintaining persistency of excitation (PoE) is integral to ensuring convergence of parameter estimates in dynamical systems to their robust optima. In this work, we show that network training using gradient descent is equivalent to a dynamical system parameter estimation problem. Leveraging this relationship, we prove a sufficient condition for PoE of gradient descent is achieved when the learning rate is less than the inverse of the Lipschitz constant of the gradient of loss function. We provide an efficient technique for estimating the corresponding Lipschitz constant using extreme value theory and demonstrate that by only scaling the learning rate schedule we can increase adversarial accuracy by up to 15% points on benchmark datasets. Our approach also universally increases the adversarial accuracy by 0.1% to 0.3% points in various state-of-the-art adversarially trained models on the AutoAttack benchmark, where every small margin of improvement is significant.
updated: Mon Jun 07 2021 16:12:55 GMT+0000 (UTC)
published: Thu Jun 03 2021 18:49:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト