arXiv reaDer
事前トレーニング済みモデルCLIPに基づくゼロショット分布外検出
Zero-Shot Out-of-Distribution Detection Based on the Pre-trained Model CLIP
分布外(OOD)検出問題では、既知のクラス(分布内クラスとも呼ばれます)のサンプルを使用して、特別な分類器をトレーニングします。テストでは、分類器は(1)既知のクラスのテストサンプルをそれぞれのクラスに分類し、(2)既知のクラスのいずれにも属さない(つまり、未知のクラスまたはOODクラスに属する)サンプルを検出できます。このホワイトペーパーでは、ゼロショットの分布外(OOD)検出の問題を調査します。これは、テストで同じ2つのタスクを実行しますが、指定された既知のクラス名を使用する以外はトレーニングを行いません。この論文は、問題を解決するための斬新でありながら単純な方法(ZOCと呼ばれる)を提案します。 ZOCは、マルチモーダル表現学習によるゼロショット分類の最近の進歩に基づいて構築されています。まず、CLIPの上にテキストベースの画像記述ジェネレーターをトレーニングすることにより、事前にトレーニングされた言語ビジョンモデルCLIPを拡張します。テストでは、拡張モデルを使用して各テストサンプルの未知のクラス名の候補を生成し、ゼロショットOOD検出の既知のクラス名と未知のクラス名の両方に基づいて信頼スコアを計算します。 OOD検出用の5つのベンチマークデータセットに関する実験結果は、ZOCがベースラインを大幅に上回っていることを示しています。
In an out-of-distribution (OOD) detection problem, samples of known classes(also called in-distribution classes) are used to train a special classifier. In testing, the classifier can (1) classify the test samples of known classes to their respective classes and also (2) detect samples that do not belong to any of the known classes (i.e., they belong to some unknown or OOD classes). This paper studies the problem of zero-shot out-of-distribution(OOD) detection, which still performs the same two tasks in testing but has no training except using the given known class names. This paper proposes a novel yet simple method (called ZOC) to solve the problem. ZOC builds on top of the recent advances in zero-shot classification through multi-modal representation learning. It first extends the pre-trained language-vision model CLIP by training a text-based image description generator on top of CLIP. In testing, it uses the extended model to generate candidate unknown class names for each test sample and computes a confidence score based on both the known class names and candidate unknown class names for zero-shot OOD detection. Experimental results on 5 benchmark datasets for OOD detection demonstrate that ZOC outperforms the baselines by a large margin.
updated: Tue Mar 22 2022 17:53:38 GMT+0000 (UTC)
published: Mon Sep 06 2021 21:27:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト