arXiv reaDer
LTD:堅牢な敵対的訓練のための低温蒸留
LTD: Low Temperature Distillation for Robust Adversarial Training
敵対的トレーニングは、敵対的攻撃に対するニューラルネットワークモデルの堅牢性を強化するために広く使用されています。ただし、自然の精度と堅牢な精度の間には、依然として顕著なギャップがあります。その理由の1つは、一般的に使用されるラベルであるワンホットベクトルが画像認識の学習プロセスを妨げることであることがわかりました。この論文では、低温蒸留(LTD)と呼ばれる方法を提案しました。これは、知識蒸留フレームワークに基づいて、目的のソフトラベルを生成します。前の作品とは異なり、LTDは教師モデルで比較的低い温度を使用し、教師モデルと学生モデルで異なるが固定された温度を採用しています。さらに、LTDで自然データと敵対的データの使用を相乗的に使用する方法を調査しました。実験結果は、追加のラベルなしデータなしで、前の作業と組み合わせた提案された方法が、CIFAR-10およびCIFAR-100データセットでそれぞれ57.72%および30.36%の堅牢な精度を達成できることを示しています。これは、現状の約1.21%の改善です。 -平均してアートメソッド。
Adversarial training has been widely used to enhance the robustness of the neural network models against adversarial attacks. However, there still a notable gap between the nature accuracy and the robust accuracy. We found one of the reasons is the commonly used labels, one-hot vectors, hinder the learning process for image recognition. In this paper, we proposed a method, called Low Temperature Distillation (LTD), which is based on the knowledge distillation framework to generate the desired soft labels. Unlike the previous work, LTD uses relatively low temperature in the teacher model, and employs different, but fixed, temperatures for the teacher model and the student model. Moreover, we have investigated the methods to synergize the use of nature data and adversarial ones in LTD. Experimental results show that without extra unlabeled data, the proposed method combined with the previous work can achieve 57.72% and 30.36% robust accuracy on CIFAR-10 and CIFAR-100 dataset respectively, which is about 1.21% improvement of the state-of-the-art methods in average.
updated: Sun Apr 10 2022 04:15:11 GMT+0000 (UTC)
published: Wed Nov 03 2021 16:26:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト