arXiv reaDer
CFA: クラスごとに調整された公正な敵対的トレーニング
CFA: Class-wise Calibrated Fair Adversarial Training
敵対的トレーニングは、ディープ ニューラル ネットワーク (DNN) の敵対的サンプルに対する敵対的ロバスト性を改善する最も効果的な方法として広く認められています。これまでのところ、ほとんどの既存の作業は、トレーニング フェーズとテスト フェーズの両方で各クラスを同等に扱い、全体的なモデルの堅牢性を強化することに重点を置いています。クラス間のロバスト性の格差を明らかにしていますが、全体的なロバスト性を犠牲にすることなく、クラスレベルで敵対的トレーニングを公平にしようとする研究はほとんどありません。この論文では、摂動マージン、正則化、加重平均化など、敵対的構成に対するさまざまなクラスの好みを理論的および経験的に調査した最初の研究者です。これに動機付けられて、各クラスの特定のトレーニング構成を自動的にカスタマイズする、CFA という名前のクラスごとに調整された公平な敵対的トレーニング フレームワークをさらに提案します。ベンチマーク データセットの実験は、提案された CFA が他の最先端の方法よりも全体的な堅牢性と公平性の両方を特に改善できることを示しています。コードは https://github.com/PKU-ML/CFA で入手できます。
Adversarial training has been widely acknowledged as the most effective method to improve the adversarial robustness against adversarial examples for Deep Neural Networks (DNNs). So far, most existing works focus on enhancing the overall model robustness, treating each class equally in both the training and testing phases. Although revealing the disparity in robustness among classes, few works try to make adversarial training fair at the class level without sacrificing overall robustness. In this paper, we are the first to theoretically and empirically investigate the preference of different classes for adversarial configurations, including perturbation margin, regularization, and weight averaging. Motivated by this, we further propose a Class-wise calibrated Fair Adversarial training framework, named CFA, which customizes specific training configurations for each class automatically. Experiments on benchmark datasets demonstrate that our proposed CFA can improve both overall robustness and fairness notably over other state-of-the-art methods. Code is available at https://github.com/PKU-ML/CFA.
updated: Sat Mar 25 2023 13:05:16 GMT+0000 (UTC)
published: Sat Mar 25 2023 13:05:16 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト