arXiv reaDer
堅牢性は正確にオッズになる可能性があります
Robustness May Be at Odds with Accuracy
  敵対的堅牢性の目標と標準的な一般化の目標との間に固有の緊張関係が存在する可能性があることを示します。具体的には、堅牢なモデルのトレーニングはリソースをより多く消費するだけでなく、標準精度の低下にもつながります。モデルの標準精度と敵の摂動に対するロバスト性との間のこのトレードオフは、かなり単純で自然な設定で存在することが証明されています。これらの発見は、より複雑な設定で経験的に観察された同様の現象を裏付けています。さらに、この現象は、堅牢な分類器が標準的な分類器とは根本的に異なる特徴表現を学習した結果であると主張します。これらの違いは、特に、予期しない利点をもたらすようです。ロバストモデルによって学習された表現は、顕著なデータの特性と人間の知覚によりよく一致する傾向があります。
We show that there may exist an inherent tension between the goal of adversarial robustness and that of standard generalization. Specifically, training robust models may not only be more resource-consuming, but also lead to a reduction of standard accuracy. We demonstrate that this trade-off between the standard accuracy of a model and its robustness to adversarial perturbations provably exists in a fairly simple and natural setting. These findings also corroborate a similar phenomenon observed empirically in more complex settings. Further, we argue that this phenomenon is a consequence of robust classifiers learning fundamentally different feature representations than standard classifiers. These differences, in particular, seem to result in unexpected benefits: the representations learned by robust models tend to align better with salient data characteristics and human perception.
updated: Mon Sep 09 2019 08:09:25 GMT+0000 (UTC)
published: Wed May 30 2018 18:00:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト