arXiv reaDer
セマンティック ドリブン エネルギー ベースのアウト オブ ディストリビューション検出
Semantic Driven Energy based Out-of-Distribution Detection
分類やオブジェクト検出など、実世界のビジュアル アプリケーションで Out-of-Distribution (OOD) サンプルを検出することは、今日のディープ ラーニング システムの展開において必要な前提条件になっています。多くの手法が提案されていますが、そのうちエネルギーベースの OOD 手法は有望であることが証明され、印象的なパフォーマンスを達成しています。エンド ツー エンドのトレーニング可能なシステムであり、最適化が容易なセマンティック主導のエネルギー ベースの方法を提案します。分布内のサンプルと分布外のサンプルを、エネルギー スコアと表現スコアを組み合わせて区別します。これは、分布内サンプルのエネルギーを最小化すると同時に、より近いそれぞれのクラス表現を学習し、分布外サンプルのエネルギーを最大化し、それらの表現を既知のクラス表現からさらに押し出すことによって実現します。さらに、クラスター焦点損失 (CFL) と呼ばれる新しい損失関数を提案します。これは、シンプルでありながら、より優れたクラスごとのクラスター中心表現を学習するのに非常に効果的であることが証明されています。私たちの新しいアプローチは異常値の検出を強化し、一般的なベンチマークでエネルギーベースのモデルとして最先端を達成することがわかりました。 CIFAR-10 および CIFAR-100 でトレーニングされた WideResNet では、既存のエネルギー ベースのアプローチと比較して、モデルは相対平均偽陽性率 (真陽性率 95% で) をそれぞれ 67.2% および 57.4% 大幅に削減します。さらに、オブジェクト検出のフレームワークを拡張し、パフォーマンスの向上を実現します。
Detecting Out-of-Distribution (OOD) samples in real world visual applications like classification or object detection has become a necessary precondition in today's deployment of Deep Learning systems. Many techniques have been proposed, of which Energy based OOD methods have proved to be promising and achieved impressive performance. We propose semantic driven energy based method, which is an end-to-end trainable system and easy to optimize. We distinguish in-distribution samples from out-distribution samples with an energy score coupled with a representation score. We achieve it by minimizing the energy for in-distribution samples and simultaneously learn respective class representations that are closer and maximizing energy for out-distribution samples and pushing their representation further out from known class representation. Moreover, we propose a novel loss function which we call Cluster Focal Loss(CFL) that proved to be simple yet very effective in learning better class wise cluster center representations. We find that, our novel approach enhances outlier detection and achieve state-of-the-art as an energy-based model on common benchmarks. On CIFAR-10 and CIFAR-100 trained WideResNet, our model significantly reduces the relative average False Positive Rate(at True Positive Rate of 95%) by 67.2% and 57.4% respectively, compared to the existing energy based approaches. Further, we extend our framework for object detection and achieve improved performance.
updated: Tue Aug 23 2022 07:40:34 GMT+0000 (UTC)
published: Tue Aug 23 2022 07:40:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト