arXiv reaDer
アダプティブ敵対ロジットペアリング
Adaptive Adversarial Logits Pairing
敵対的な例は、画像分類システムを理解するための機会を提供するだけでなく、課題を課します。敵対的トレーニングソリューションの敵対的ロジットペアリング(ALP)の分析に基づいて、この作業で次のことを観察しました。(1)敵対的にロバストなモデルの推論は、脆弱なモデルと比較して、より少ない貢献度の機能に依存する傾向があります。 (2)ALPのトレーニング目標は、ロジットのペアリング損失が強調されすぎて分類損失の最小化を妨げるサンプルの目立つ部分にうまく適合しません。これらの観察に動機付けられて、ALPのトレーニングプロセスとトレーニングターゲットを変更することにより、適応型敵対ロジットペアリング(AALP)ソリューションを設計します。具体的には、AALPは、ガイド付きドロップアウトを備えた適応型機能最適化モジュールで構成され、貢献度の高い機能を体系的に追求します。また、サンプル固有のトレーニング重みを設定してロジットのペアリング損失と分類損失のバランスをとることによる適応型サンプル重み付けモジュールで構成されます。提案されたAALPソリューションは、広範な実験により、複数のデータセットで優れた防御パフォーマンスを示しています。
Adversarial examples provide an opportunity as well as impose a challenge for understanding image classification systems. Based on the analysis of the adversarial training solution Adversarial Logits Pairing (ALP), we observed in this work that: (1) The inference of adversarially robust model tends to rely on fewer high-contribution features compared with vulnerable ones. (2) The training target of ALP doesn't fit well to a noticeable part of samples, where the logits pairing loss is overemphasized and obstructs minimizing the classification loss. Motivated by these observations, we design an Adaptive Adversarial Logits Pairing (AALP) solution by modifying the training process and training target of ALP. Specifically, AALP consists of an adaptive feature optimization module with Guided Dropout to systematically pursue fewer high-contribution features, and an adaptive sample weighting module by setting sample-specific training weights to balance between logits pairing loss and classification loss. The proposed AALP solution demonstrates superior defense performance on multiple datasets with extensive experiments.
updated: Fri Apr 16 2021 01:57:11 GMT+0000 (UTC)
published: Mon May 25 2020 03:12:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト