arXiv reaDer
有害なデータセットを適応的に分割することによるバックドア防御
Backdoor Defense via Adaptively Splitting Poisoned Dataset
ディープ ニューラル ネットワーク (DNN) がバックドア攻撃を受けて悪意を持って改ざんされるという脅威を軽減するために、バックドア防御が研究されています。 DNN は通常、信頼できないサードパーティからの外部トレーニング データを採用するため、トレーニング段階での堅牢なバックドア防御戦略が重要です。トレーニング時の防御の核心は、汚染されたサンプルを選択して適切に処理することであると主張します。この作業では、汚染されたデータセットを 2 つのデータ プールに分割する統合フレームワークからのトレーニング時間防御を要約します。私たちのフレームワークの下で、適応的に分割するデータセットベースの防御 (ASD) を提案します。具体的には、損失ガイド分割とメタ学習にヒントを得た分割を適用して、2 つのデータ プールを動的に更新します。分割されたクリーン データ プールと汚染されたデータ プールを使用して、ASD はトレーニング中のバックドア攻撃をうまく防御します。 6 つの最先端のバックドア攻撃に対する複数のベンチマーク データセットと DNN モデルに関する広範な実験は、当社の ASD の優位性を示しています。コードは https://github.com/KuofengGao/ASD で入手できます。
Backdoor defenses have been studied to alleviate the threat of deep neural networks (DNNs) being backdoor attacked and thus maliciously altered. Since DNNs usually adopt some external training data from an untrusted third party, a robust backdoor defense strategy during the training stage is of importance. We argue that the core of training-time defense is to select poisoned samples and to handle them properly. In this work, we summarize the training-time defenses from a unified framework as splitting the poisoned dataset into two data pools. Under our framework, we propose an adaptively splitting dataset-based defense (ASD). Concretely, we apply loss-guided split and meta-learning-inspired split to dynamically update two data pools. With the split clean data pool and polluted data pool, ASD successfully defends against backdoor attacks during training. Extensive experiments on multiple benchmark datasets and DNN models against six state-of-the-art backdoor attacks demonstrate the superiority of our ASD. Our code is available at https://github.com/KuofengGao/ASD.
updated: Thu Mar 23 2023 02:16:38 GMT+0000 (UTC)
published: Thu Mar 23 2023 02:16:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト