arXiv reaDer
分布外データの検出とキャリブレーションのための共変量と概念シフトの調査
Exploring Covariate and Concept Shift for Detection and Calibration of Out-of-Distribution Data
配布中のデータのテストを超えて、配布外(OOD)の検出に関する作業が最近人気が高まっています。 OODデータを分類する最近の試みでは、近距離および遠距離のOOD検出の概念が導入されています。具体的には、これまでの研究では、検出の難しさの観点からOODデータの特性を定義しています。共変量シフトと概念シフトの2種類の分布シフトを使用して、OODデータのスペクトルを特徴付けることを提案します。共変量シフトは、ノイズなどのスタイルの変化に対応し、概念シフトはセマンティクスの変化を示します。この特性は、各タイプのシフトに対する感度がOODデータの検出と信頼性キャリブレーションにとって重要であることを示しています。したがって、各タイプのデータセットシフトに対する感度をキャプチャするスコア関数とそれらを改善する方法を調査します。この目的のために、OOD検出の2つのスコア関数、共変量シフトスコアと概念シフトスコアを、両方のスコアのKL発散の分解に基づいて理論的に導出し、OOD検出を改善するための幾何学的に着想を得た方法(Geometric ODIN)を提案します。両方のシフトの下で、分布データのみを使用します。さらに、提案された方法は、当然、分布内データと分布外データの両方で最先端のキャリブレーションパフォーマンスをもたらす表現力豊かな事後キャリブレーション機能につながります。私たちは、OODの検出とキャリブレーションの両方で、さまざまなタイプのシフトの下でうまく機能する方法を最初に提案しました。 https://sites.google.com/view/geometric-decompositionでプロジェクトページを表示します。
Moving beyond testing on in-distribution data works on Out-of-Distribution (OOD) detection have recently increased in popularity. A recent attempt to categorize OOD data introduces the concept of near and far OOD detection. Specifically, prior works define characteristics of OOD data in terms of detection difficulty. We propose to characterize the spectrum of OOD data using two types of distribution shifts: covariate shift and concept shift, where covariate shift corresponds to change in style, e.g., noise, and concept shift indicates a change in semantics. This characterization reveals that sensitivity to each type of shift is important to the detection and confidence calibration of OOD data. Consequently, we investigate score functions that capture sensitivity to each type of dataset shift and methods that improve them. To this end, we theoretically derive two score functions for OOD detection, the covariate shift score and concept shift score, based on the decomposition of KL-divergence for both scores, and propose a geometrically-inspired method (Geometric ODIN) to improve OOD detection under both shifts with only in-distribution data. Additionally, the proposed method naturally leads to an expressive post-hoc calibration function which yields state-of-the-art calibration performance on both in-distribution and out-of-distribution data. We are the first to propose a method that works well across both OOD detection and calibration and under different types of shifts. View project page at https://sites.google.com/view/geometric-decomposition.
updated: Sun Nov 21 2021 20:35:07 GMT+0000 (UTC)
published: Thu Oct 28 2021 15:42:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト