arXiv reaDer
Transformaly-2つの(機能スペース)は1つよりも優れています
Transformaly -- Two (Feature Spaces) Are Better Than One
異常検出は、所定の分布外のサンプルを特定しようとする確立された研究分野です。異常検出パイプラインは、(1)特徴抽出と(2)正規性スコアの割り当てという2つの主要な段階で構成されています。最近の論文では、特徴抽出に事前にトレーニングされたネットワークを使用して、最先端の結果を達成しています。ただし、事前にトレーニングされたネットワークを使用しても、トレーニング時に利用できる通常のサンプルを十分に活用することはできません。この論文は、教師と生徒のトレーニングを使用してこの情報を利用することを提案します。私たちの設定では、事前にトレーニングされた教師ネットワークを使用して、通常のトレーニングサンプルで学生ネットワークをトレーニングします。学生ネットワークは通常のサンプルでのみトレーニングされているため、異常な場合には教師ネットワークから逸脱することが予想されます。この違いは、事前にトレーニングされた特徴ベクトルを補完するものとして機能します。私たちの方法であるTransformalyは、事前にトレーニングされたVision Transformer(ViT)を利用して、事前にトレーニングされた(不可知論的な)特徴と教師と生徒の(微調整された)特徴の両方の特徴ベクトルを抽出します。最先端のAUROCの結果は、1つのクラスが正常と見なされ、残りが異常と見なされる一般的なユニモーダル設定と、1つを除くすべてのクラスが正常と見なされ、1つのクラスのみが正常であると見なされるマルチモーダル設定の両方で報告されます。異常と見なされます。コードはhttps://github.com/MatanCohen1/Transformalyで入手できます。
Anomaly detection is a well-established research area that seeks to identify samples outside of a predetermined distribution. An anomaly detection pipeline is comprised of two main stages: (1) feature extraction and (2) normality score assignment. Recent papers used pre-trained networks for feature extraction achieving state-of-the-art results. However, the use of pre-trained networks does not fully-utilize the normal samples that are available at train time. This paper suggests taking advantage of this information by using teacher-student training. In our setting, a pretrained teacher network is used to train a student network on the normal training samples. Since the student network is trained only on normal samples, it is expected to deviate from the teacher network in abnormal cases. This difference can serve as a complementary representation to the pre-trained feature vector. Our method -- Transformaly -- exploits a pre-trained Vision Transformer (ViT) to extract both feature vectors: the pre-trained (agnostic) features and the teacher-student (fine-tuned) features. We report state-of-the-art AUROC results in both the common unimodal setting, where one class is considered normal and the rest are considered abnormal, and the multimodal setting, where all classes but one are considered normal, and just one class is considered abnormal. The code is available at https://github.com/MatanCohen1/Transformaly.
updated: Wed Dec 08 2021 09:21:31 GMT+0000 (UTC)
published: Wed Dec 08 2021 09:21:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト