arXiv reaDer
OTJR: 敵対的ロバスト性のための最適なトランスポートと最適なヤコビアン正則化の出会い
OTJR: Optimal Transport Meets Optimal Jacobian Regularization for Adversarial Robustness
ディープ ニューラル ネットワークは、敵対的摂動に対して脆弱であると広く認識されています。この課題を克服するには、堅牢な分類器を開発することが重要です。これまでのところ、堅牢な分類器の学習を改善するために、敵対的トレーニング (AT) とヤコビアン正則化という 2 つのよく知られた防御が採用されています。ただし、各アプローチは、敵対的摂動に対して異なる動作をします。まず、私たちの研究では、理論的および経験的にこれら 2 つのアプローチの流派を注意深く分析し、特徴付けて、各アプローチが分類子の堅牢な学習にどのように影響するかを示します。次に、OTJR と呼ばれる、ヤコビアン正則化法を使用した新しい最適トランスポートを提案します。これは、最適輸送理論を活用して、入力と出力のヤコビアン正則化を AT に組み込んでいます。特に、データセット内のクラスの数に関係なく、敵対的サンプルの表現をクリーンなサンプルの表現に効率的に近づけることができるスライス ワッサースタイン (SW) 距離を採用しています。 SW 距離は敵対的サンプルの移動方向を提供します。これは、ヤコビアン正則化にとってより有益で強力です。私たちの広範な実験は、提案された方法の有効性を示しています。これは、AT にヤコビアン正則化を共同で組み込んでいます。さらに、提案された方法が、さまざまな敵対的攻撃設定の下で CIFAR-100 データセットを使用してモデルの堅牢性を一貫して強化し、AutoAttack の下で最大 28.49% を達成することを示します。
Deep neural networks are widely recognized as being vulnerable to adversarial perturbation. To overcome this challenge, developing a robust classifier is crucial. So far, two well-known defenses have been adopted to improve the learning of robust classifiers, namely adversarial training (AT) and Jacobian regularization. However, each approach behaves differently against adversarial perturbations. First, our work carefully analyzes and characterizes these two schools of approaches, both theoretically and empirically, to demonstrate how each approach impacts the robust learning of a classifier. Next, we propose our novel Optimal Transport with Jacobian regularization method, dubbed OTJR, jointly incorporating the input-output Jacobian regularization into the AT by leveraging the optimal transport theory. In particular, we employ the Sliced Wasserstein (SW) distance that can efficiently push the adversarial samples' representations closer to those of clean samples, regardless of the number of classes within the dataset. The SW distance provides the adversarial samples' movement directions, which are much more informative and powerful for the Jacobian regularization. Our extensive experiments demonstrate the effectiveness of our proposed method, which jointly incorporates Jacobian regularization into AT. Furthermore, we demonstrate that our proposed method consistently enhances the model's robustness with CIFAR-100 dataset under various adversarial attack settings, achieving up to 28.49% under AutoAttack.
updated: Tue Mar 21 2023 12:22:59 GMT+0000 (UTC)
published: Tue Mar 21 2023 12:22:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト