arXiv reaDer
CLIPを拡張することによるゼロショット開集合の検出
Zero-Shot Open Set Detection by Extending CLIP
通常の開集合検出問題では、既知のクラス(閉集合クラスとも呼ばれます)のサンプルを使用して、特別な分類器をトレーニングします。テストでは、分類器は(1)既知のクラスのテストサンプルをそれぞれのクラスに分類し、(2)既知のクラスのいずれにも属さないサンプルを検出することもできます(未知のクラスまたは開集合クラスに属すると言います) 。このホワイトペーパーでは、ゼロショット開集合検出の問題を調査します。この問題は、テストで同じ2つのタスクを実行しますが、指定された既知のクラス名を使用する以外はトレーニングを行いません。この論文は、問題を解決するための斬新でありながら単純な方法(ZO-CLIPと呼ばれる)を提案します。 ZO-CLIPは、マルチモーダル表現学習によるゼロショット分類の最近の進歩に基づいて構築されています。まず、CLIPの上にテキストベースの画像記述ジェネレーターをトレーニングすることにより、事前にトレーニングされたマルチモーダルモデルCLIPを拡張します。テストでは、拡張モデルを使用して、各テストサンプルの不明なクラス名の候補を生成し、ゼロショット開集合検出の既知のクラス名と不明なクラス名の両方に基づいて信頼スコアを計算します。オープンセット検出用の5つのベンチマークデータセットでの実験結果は、ZO-CLIPがベースラインを大幅に上回っていることを確認しています。
In a regular open set detection problem, samples of known classes (also called closed set classes) are used to train a special classifier. In testing, the classifier can (1) classify the test samples of known classes to their respective classes and (2) also detect samples that do not belong to any of the known classes (we say they belong to some unknown or open set classes). This paper studies the problem of zero-shot open-set detection, which still performs the same two tasks in testing but has no training except using the given known class names. This paper proposes a novel and yet simple method (called ZO-CLIP) to solve the problem. ZO-CLIP builds on top of the recent advances in zero-shot classification through multi-modal representation learning. It first extends the pre-trained multi-modal model CLIP by training a text-based image description generator on top of CLIP. In testing, it uses the extended model to generate some candidate unknown class names for each test sample and computes a confidence score based on both the known class names and candidate unknown class names for zero-shot open set detection. Experimental results on 5 benchmark datasets for open set detection confirm that ZO-CLIP outperforms the baselines by a large margin.
updated: Fri Sep 10 2021 20:22:15 GMT+0000 (UTC)
published: Mon Sep 06 2021 21:27:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト