敵対攻撃に対する深層学習モデルの堅牢性は、近年注目を集めています。ただし、ディープラーニングと敵対的トレーニングの両方は、大量のラベル付きデータの可用性に依存しており、通常、ごく少数のトレーニングサンプルにしかアクセスできない場合、新しい目に見えないクラスにうまく一般化されません。この問題に対処するために、新しい挑戦的な問題を明確に紹介します-クラスごとに制限されたトレーニングサンプルを使用した堅牢なディープモデルを学習する方法です。文献にある既存の敵対的訓練手法を単に採用しても、この問題を解決することはできません。これは、少数ショット学習が互いに素な補助データから転送可能な知識を学習する必要があるため、既存の敵対的トレーニング手法で一般的に想定されているように、トレーニングセットとテストセット間のサンプルレベルの分布の一貫性を想定することは無効だからです。この論文では、このような分布の一貫性を仮定する代わりに、防衛知識をよりよく伝達するために、エピソードトレーニングパラダイムのタスクレベルでこの仮定を行うことを提案します。さらに、各タスク内で、タスクレベルの分布制約を設計して、サンプルレベルでクリーンな例と敵対的な例の分布ギャップを狭めます。これらは、譲渡可能な敵の防御を学習するためのマルチレベル分布ベースの敵訓練(MDAT)と呼ばれる新しいメカニズムを生み出します。さらに、統一されたF_βスコアが導入され、同じ原則の下でさまざまな防御方法を評価します。広範な実験により、MDATが少数のケースで既存の代替案よりも高い有効性と堅牢性を達成することが実証されています。
The robustness of deep learning models against adversarial attacks has received increasing attention in recent years. However, both deep learning and adversarial training rely on the availability of a large amount of labeled data and usually do not generalize well to new, unseen classes when only a few training samples are accessible. To address this problem, we explicitly introduce a new challenging problem -- how to learn a robust deep model with limited training samples per class, called defensive few-shot learning in this paper. Simply employing the existing adversarial training techniques in the literature cannot solve this problem. This is because few-shot learning needs to learn transferable knowledge from disjoint auxiliary data, and thus it is invalid to assume the sample-level distribution consistency between the training and test sets as commonly assumed in existing adversarial training techniques. In this paper, instead of assuming such a distribution consistency, we propose to make this assumption at a task-level in the episodic training paradigm in order to better transfer the defense knowledge. Furthermore, inside each task, we design a task-conditioned distribution constraint to narrow the distribution gap between clean and adversarial examples at a sample-level. These give rise to a novel mechanism called multi-level distribution based adversarial training (MDAT) for learning transferable adversarial defense. In addition, a unified F_β score is introduced to evaluate different defense methods under the same principle. Extensive experiments demonstrate that MDAT achieves higher effectiveness and robustness over existing alternatives in the few-shot case.