arXiv reaDer
ドメイン不変の敵対的学習
Domain Invariant Adversarial Learning
敵対的な例の現象は、ディープニューラルネットワークの最も基本的な脆弱性の1つを示しています。この固有の弱点を克服するために導入されたさまざまな技術の中で、敵対的な訓練は、堅牢性を達成するための最も一般的で効率的な戦略として浮上しています。通常、これは堅牢な目的と自然な目的のバランスをとることによって達成されます。この作業では、ドメイン不変の特徴表現を適用することにより、堅牢なパフォーマンスと自然なパフォーマンスの間のより良いトレードオフを達成することを目指しています。新しい敵対的トレーニング方法であるドメイン不変敵対的学習(DIAL)を紹介します。これは、堅牢でドメイン不変の両方の特徴表現を学習します。 DIALは、自然ドメインとそれに対応する敵対的ドメインでドメイン敵対的ニューラルネットワーク(DANN)のバリアントを使用します。ソースドメインが自然な例で構成され、ターゲットドメインが敵対的に摂動された例である場合、私たちの方法は、自然な例と敵対的な例を区別しないように制約された特徴表現を学習するため、より堅牢な表現を実現できます。私たちの実験は、現在の最先端の敵対訓練方法と比較した場合、私たちの方法が堅牢性と自然な精度の両方を改善することを示しています。
The phenomenon of adversarial examples illustrates one of the most basic vulnerabilities of deep neural networks. Among the variety of techniques introduced to surmount this inherent weakness, adversarial training has emerged as the most common and efficient strategy to achieve robustness. Typically, this is achieved by balancing robust and natural objectives. In this work, we aim to achieve better trade-off between robust and natural performances by enforcing a domain-invariant feature representation. We present a new adversarial training method, Domain Invariant Adversarial Learning (DIAL), which learns a feature representation which is both robust and domain invariant. DIAL uses a variant of Domain Adversarial Neural Network (DANN) on the natural domain and its corresponding adversarial domain. In a case where the source domain consists of natural examples and the target domain is the adversarially perturbed examples, our method learns a feature representation constrained not to discriminate between the natural and adversarial examples, and can therefore achieve a more robust representation. Our experiments indicate that our method improves both robustness and natural accuracy, when compared to current state-of-the-art adversarial training methods.
updated: Sun Jun 20 2021 14:23:20 GMT+0000 (UTC)
published: Thu Apr 01 2021 08:04:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト