arXiv reaDer
Pyramid Adversarial Training は ViT のパフォーマンスを向上させます
Pyramid Adversarial Training Improves ViT Performance
積極的なデータ拡張は、Vision Transformer (ViT) の強力な一般化機能の重要な要素です。そのようなデータ拡張手法の 1 つが敵対的トレーニング (AT) です。ただし、多くの以前の研究では、これにより多くの場合、クリーン精度が低下することが示されています。この作業では、ViT の全体的なパフォーマンスを向上させるためのシンプルで効果的な手法であるピラミッド敵対的トレーニング (PyramidAT) を紹介します。これを、「一致した」ドロップアウトおよび確率的深度正則化と組み合わせます。これは、クリーン サンプルと敵対的サンプルに同じドロップアウトおよび確率的深度構成を採用します。 AdvProp による CNN の改善 (ViT には直接適用されません) と同様に、当社のピラミッド敵対的トレーニングは、ViT および関連アーキテクチャの配布内の精度と配布外の堅牢性との間のトレードオフを解消します。 ImageNet-1K データのみでトレーニングした場合、ViT-B モデルの ImageNet クリーン精度が 1.82% 絶対的に向上し、同時に 7 つの ImageNet 堅牢性メトリックのパフォーマンスが 1.76% から 15.68% の範囲の絶対値で向上します。 ViT-B/16 バックボーンと私たちのピラミッドの敵対的トレーニング。私たちのコードは、pyramidat.github.io で公開されています。
Aggressive data augmentation is a key component of the strong generalization capabilities of Vision Transformer (ViT). One such data augmentation technique is adversarial training (AT); however, many prior works have shown that this often results in poor clean accuracy. In this work, we present pyramid adversarial training (PyramidAT), a simple and effective technique to improve ViT's overall performance. We pair it with a "matched" Dropout and stochastic depth regularization, which adopts the same Dropout and stochastic depth configuration for the clean and adversarial samples. Similar to the improvements on CNNs by AdvProp (not directly applicable to ViT), our pyramid adversarial training breaks the trade-off between in-distribution accuracy and out-of-distribution robustness for ViT and related architectures. It leads to 1.82% absolute improvement on ImageNet clean accuracy for the ViT-B model when trained only on ImageNet-1K data, while simultaneously boosting performance on 7 ImageNet robustness metrics, by absolute numbers ranging from 1.76% to 15.68%. We set a new state-of-the-art for ImageNet-C (41.42 mCE), ImageNet-R (53.92%), and ImageNet-Sketch (41.04%) without extra data, using only the ViT-B/16 backbone and our pyramid adversarial training. Our code is publicly available at pyramidat.github.io.
updated: Fri Sep 02 2022 21:24:06 GMT+0000 (UTC)
published: Tue Nov 30 2021 04:38:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト