arXiv reaDer
REGroup:ロバストな予測のための生成分類器のランク集約アンサンブル
REGroup: Rank-aggregating Ensemble of Generative Classifiers for Robust Predictions
ディープニューラルネットワーク(DNN)は、敵対的な攻撃を受けやすいと批判されることがよくあります。ほとんどの成功した防御戦略は、敵対的なトレーニングまたはランダムな入力変換を採用しており、通常、妥当なパフォーマンスを達成するためにモデルを再トレーニングまたは微調整する必要があります。この作業では、事前にトレーニングされたDNNの中間表現の調査により、敵対的な攻撃に対する本質的な堅牢性を示す興味深い発見がもたらされます。トレーニングサンプルをクリーンアップするための中間層の神経応答を統計的に特徴付けることにより、生成分類器を学習できることがわかります。複数のそのような中間層ベースの分類器の予測は、集約されると、敵対的な攻撃に対して予想外の堅牢性を示します。具体的には、ボルダカウントベースのコンセンサスを介して予測をランク集約するこれらの生成分類器のアンサンブルを考案します。私たちが提案するアプローチは、クリーンなトレーニングデータのサブセットと事前にトレーニングされたモデルを使用しますが、ネットワークアーキテクチャや敵対的な攻撃の生成方法には依存しません。私たちの防衛戦略がImageNet検証セットで最先端のパフォーマンスを達成することを確立するための広範な実験を示します。
Deep Neural Networks (DNNs) are often criticized for being susceptible to adversarial attacks. Most successful defense strategies adopt adversarial training or random input transformations that typically require retraining or fine-tuning the model to achieve reasonable performance. In this work, our investigations of intermediate representations of a pre-trained DNN lead to an interesting discovery pointing to intrinsic robustness to adversarial attacks. We find that we can learn a generative classifier by statistically characterizing the neural response of an intermediate layer to clean training samples. The predictions of multiple such intermediate-layer based classifiers, when aggregated, show unexpected robustness to adversarial attacks. Specifically, we devise an ensemble of these generative classifiers that rank-aggregates their predictions via a Borda count-based consensus. Our proposed approach uses a subset of the clean training data and a pre-trained model, and yet is agnostic to network architectures or the adversarial attack generation method. We show extensive experiments to establish that our defense strategy achieves state-of-the-art performance on the ImageNet validation set.
updated: Wed Nov 24 2021 11:00:57 GMT+0000 (UTC)
published: Thu Jun 18 2020 17:07:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト