未調整の分類器としてのバニラCNNは、分布外(OOD)サンプルを分布内サンプルとほぼ同じように分類することに悩まされています。この課題に取り組むために、最近のいくつかの研究では、エンドツーエンドの校正済みCNNのトレーニングに利用可能なOODセットを活用することの利点を示しています。ただし、これらの作業では、重要な質問は未解決のままです。目に見えないOODセットに対して高い検出率でCNNのトレーニングを誘発する最も効果的なものを選択するためにOODセットをどのように区別するか?この重要な質問に対処するために、分布内の目に見えないOODセットに対して、拒否に使用される追加のクラスが追加されたバニラCNNであるAugmented-CNNの一般化エラーに基づく基準を提供します。ただし、この基準を直接最適化して最も効果的なOODセットを選択すると、膨大な計算コストが発生します。代わりに、分散サブ多様体の「保護」レベルに従ってOODセットを区別するための3つの新しい計算効率の高いメトリックを提案します。最も保護的なOODセット(測定基準に従って選択)がA-CNNにつながり、一般化エラーが最も低いAODでトレーニングされたA-CNNよりも大幅に低いことを経験的に検証します。また、よく一般化された信頼性キャリブレーションされたバニラCNNをトレーニングするための保護OODセットの有効性を経験的に示しています。これらの結果は、1)すべてのOODセットがOOD検出タスクのパフォーマンスの高いエンドツーエンドモデル(つまり、A-CNNおよび校正済みCNN)のトレーニングに等しく効果的ではないこと、および2)OODセットの保護レベルが実行可能であることを確認します最も効果的なものを認識するための要因。最後に、画像分類タスク全体で、最も保護されたOODセットでトレーニングされたA-CNNは、ブラックボックスFGSの敵の例も検出できます(それらのメトリックによって測定された)それらの距離は、保護されたサブ多様体から大きくなっています。
Vanilla CNNs, as uncalibrated classifiers, suffer from classifying out-of-distribution (OOD) samples nearly as confidently as in-distribution samples. To tackle this challenge, some recent works have demonstrated the gains of leveraging available OOD sets for training end-to-end calibrated CNNs. However, a critical question remains unanswered in these works: how to differentiate OOD sets for selecting the most effective one(s) that induce training such CNNs with high detection rates on unseen OOD sets? To address this pivotal question, we provide a criterion based on generalization errors of Augmented-CNN, a vanilla CNN with an added extra class employed for rejection, on in-distribution and unseen OOD sets. However, selecting the most effective OOD set by directly optimizing this criterion incurs a huge computational cost. Instead, we propose three novel computationally-efficient metrics for differentiating between OOD sets according to their "protection" level of in-distribution sub-manifolds. We empirically verify that the most protective OOD sets -- selected according to our metrics -- lead to A-CNNs with significantly lower generalization errors than the A-CNNs trained on the least protective ones. We also empirically show the effectiveness of a protective OOD set for training well-generalized confidence-calibrated vanilla CNNs. These results confirm that 1) all OOD sets are not equally effective for training well-performing end-to-end models (i.e., A-CNNs and calibrated CNNs) for OOD detection tasks and 2) the protection level of OOD sets is a viable factor for recognizing the most effective one. Finally, across the image classification tasks, we exhibit A-CNN trained on the most protective OOD set can also detect black-box FGS adversarial examples as their distance (measured by our metrics) is becoming larger from the protected sub-manifolds.