過去10年間、深い画像分類ネットワークの開発は、ほとんどの場合、ImageNetなどの標準化されたベンチマークでの分類精度の観点から最高のパフォーマンスを追求することによって推進されてきました。最近では、この焦点は、モデルの堅牢性の概念、つまり、データ分布のこれまでに見られなかった変化に対するモデルの一般化能力によって拡大されています。 ImageNet-Cのような新しいベンチマークは、堅牢性のプロパティを測定するために導入されましたが、固定テストセットは可能なデータ変動のごく一部しかキャプチャできないため、制限され、新しい過剰適合ソリューションを生成する傾向があると主張します。これらの欠点を克服するために、学習した特徴空間の構造からモデルのロバスト性を直接推定することをお勧めします。訓練された分類器からの潜在表現の教師なしクラスタリングを介して取得され、破損したテストデータのモデルパフォーマンスと非常に高い相関関係を示すロバスト性インジケーターを紹介します。
Over the last decade, the development of deep image classification networks has mostly been driven by the search for the best performance in terms of classification accuracy on standardized benchmarks like ImageNet. More recently, this focus has been expanded by the notion of model robustness, i.e. the generalization abilities of models towards previously unseen changes in the data distribution. While new benchmarks, like ImageNet-C, have been introduced to measure robustness properties, we argue that fixed testsets are only able to capture a small portion of possible data variations and are thus limited and prone to generate new overfitted solutions. To overcome these drawbacks, we suggest to estimate the robustness of a model directly from the structure of its learned feature-space. We introduce robustness indicators which are obtained via unsupervised clustering of latent representations from a trained classifier and show very high correlations to the model performance on corrupted test data.