この論文では、画像分類器の堅牢性の厳密なベンチマークを確立します。最初のベンチマークであるImageNet-Cは、破損に対する堅牢性のトピックを標準化および拡張すると同時に、安全性が重要なアプリケーションでどの分類器が望ましいかを示します。次に、ImageNet-Pと呼ばれる新しいデータセットを提案します。これにより、研究者は一般的な摂動に対する分類器の堅牢性をベンチマークできます。最近の堅牢性調査とは異なり、このベンチマークは、最悪の場合の敵対的摂動ではなく、一般的な破損と摂動のパフォーマンスを評価します。 AlexNet分類器からResNet分類器への相対的な破損に対する堅牢性の変化はごくわずかです。その後、破損と摂動の堅牢性を強化する方法を発見します。バイパスされた敵の防御が、かなりの一般的な摂動の堅牢性を提供することさえ発見します。これらのベンチマークを合わせて、堅牢に一般化されるネットワークに向けた将来の作業を支援できます。
In this paper we establish rigorous benchmarks for image classifier robustness. Our first benchmark, ImageNet-C, standardizes and expands the corruption robustness topic, while showing which classifiers are preferable in safety-critical applications. Then we propose a new dataset called ImageNet-P which enables researchers to benchmark a classifier's robustness to common perturbations. Unlike recent robustness research, this benchmark evaluates performance on common corruptions and perturbations not worst-case adversarial perturbations. We find that there are negligible changes in relative corruption robustness from AlexNet classifiers to ResNet classifiers. Afterward we discover ways to enhance corruption and perturbation robustness. We even find that a bypassed adversarial defense provides substantial common perturbation robustness. Together our benchmarks may aid future work toward networks that robustly generalize.