arXiv reaDer
テスト時の変換アンサンブルによる敵対的ロバスト性の強化
Enhancing Adversarial Robustness via Test-time Transformation Ensembling
ディープラーニングモデルは、敵対的攻撃として知られる知覚できない摂動にだまされる傾向があります。この作業では、モデルにTest-time Transformation Ensembling(TTE)を装備することで、このような攻撃に対する信頼できる防御としてどのように機能するかを研究します。トレーニング時とテスト時の両方で入力データを変換すると、モデルのパフォーマンスが向上することが知られていますが、敵対的なロバスト性への影響は研究されていません。ここでは、広く使用されている画像変換の形で、敵のロバスト性に対するTTEの影響に関する包括的な実証的研究を紹介します。 TTEは、再トレーニングを必要とせずに、さまざまな強力な攻撃に対するモデルの堅牢性を一貫して改善し、この改善は、クリーンなサンプルの精度と実質的にトレードオフがないことを示しています。最後に、TTEが大幅で一貫性のある改善を提供する、認定された堅牢性ドメインにもTTEの利点が移行することを示します。
Deep learning models are prone to being fooled by imperceptible perturbations known as adversarial attacks. In this work, we study how equipping models with Test-time Transformation Ensembling (TTE) can work as a reliable defense against such attacks. While transforming the input data, both at train and test times, is known to enhance model performance, its effects on adversarial robustness have not been studied. Here, we present a comprehensive empirical study of the impact of TTE, in the form of widely-used image transforms, on adversarial robustness. We show that TTE consistently improves model robustness against a variety of powerful attacks without any need for re-training, and that this improvement comes at virtually no trade-off with accuracy on clean samples. Finally, we show that the benefits of TTE transfer even to the certified robustness domain, in which TTE provides sizable and consistent improvements.
updated: Thu Jul 29 2021 15:32:35 GMT+0000 (UTC)
published: Thu Jul 29 2021 15:32:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト