arXiv reaDer
配布外データの確実に敵対的にロバストな検出
Certifiably Adversarially Robust Detection of Out-of-Distribution Data
ディープニューラルネットワークは、明らかにどのクラスにも属していない分布外(OOD)入力に適用すると、自信過剰になることが知られています。分類器の不確実性の信頼できる評価が重要な特性であり、システムが人間の介入をトリガーしたり、安全な状態に移行したりできるため、これはセーフティクリティカルなアプリケーションの問題です。この論文では、OODポイントだけでなく、その周囲のl_∞ボールにも低い信頼性を適用することにより、OOD検出の認証可能な最悪のケースの保証を目指しています。この目的のために、間隔限界伝播(IBP)を使用して、l_∞ボールの最大信頼度を上限とし、トレーニング時間中にこの上限を最小化します。トレーニング時に見られるOODデータセットを超えて一般化するOODデータの信頼性に自明でない限界がある可能性があることを示します。さらに、通常は予測パフォーマンスが大幅に低下する認定済みの敵対的堅牢性とは対照的に、最悪の場合のOOD検出の認定済み保証は、精度を大幅に低下させることなく可能です。
Deep neural networks are known to be overconfident when applied to out-of-distribution (OOD) inputs which clearly do not belong to any class. This is a problem in safety-critical applications since a reliable assessment of the uncertainty of a classifier is a key property, allowing the system to trigger human intervention or to transfer into a safe state. In this paper, we aim for certifiable worst case guarantees for OOD detection by enforcing not only low confidence at the OOD point but also in an l_∞-ball around it. For this purpose, we use interval bound propagation (IBP) to upper bound the maximal confidence in the l_∞-ball and minimize this upper bound during training time. We show that non-trivial bounds on the confidence for OOD data generalizing beyond the OOD dataset seen at training time are possible. Moreover, in contrast to certified adversarial robustness which typically comes with significant loss in prediction performance, certified guarantees for worst case OOD detection are possible without much loss in accuracy.
updated: Wed Mar 10 2021 15:55:00 GMT+0000 (UTC)
published: Thu Jul 16 2020 17:16:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト