知識蒸留(KD)は、教師なし異常検出(AD)の困難な問題について有望な結果を達成します。教師-生徒(TS)モデルの異常の表現の不一致は、ADの本質的な証拠を提供します。ただし、以前の研究で教師と生徒のモデルを構築するために類似または同一のアーキテクチャを使用すると、異常な表現の多様性が妨げられます。この問題に取り組むために、教師エンコーダーと学生デコーダーで構成される新しいTSモデルを提案し、それに応じてシンプルで効果的な「逆蒸留」パラダイムを導入します。生の画像を直接受信する代わりに、学生ネットワークは、教師モデルの1クラスの埋め込みを入力およびターゲットとして使用して、教師のマルチスケール表現を復元します。本質的に、この研究における知識の蒸留は、抽象的な高レベルのプレゼンテーションから低レベルの機能まで始まります。さらに、TSモデルにトレーニング可能な1クラスボトルネック埋め込み(OCBE)モジュールを導入します。得られたコンパクトな埋め込みは、正常なパターンに関する重要な情報を効果的に保存しますが、異常な摂動を放棄します。 ADと1クラスのノベルティ検出ベンチマークに関する広範な実験は、私たちの方法がSOTAのパフォーマンスを上回っていることを示しており、提案されたアプローチの有効性と一般化可能性を示しています。
Knowledge distillation (KD) achieves promising results on the challenging problem of unsupervised anomaly detection (AD).The representation discrepancy of anomalies in the teacher-student (T-S) model provides essential evidence for AD. However, using similar or identical architectures to build the teacher and student models in previous studies hinders the diversity of anomalous representations. To tackle this problem, we propose a novel T-S model consisting of a teacher encoder and a student decoder and introduce a simple yet effective "reverse distillation" paradigm accordingly. Instead of receiving raw images directly, the student network takes teacher model's one-class embedding as input and targets to restore the teacher's multiscale representations. Inherently, knowledge distillation in this study starts from abstract, high-level presentations to low-level features. In addition, we introduce a trainable one-class bottleneck embedding (OCBE) module in our T-S model. The obtained compact embedding effectively preserves essential information on normal patterns, but abandons anomaly perturbations. Extensive experimentation on AD and one-class novelty detection benchmarks shows that our method surpasses SOTA performance, demonstrating our proposed approach's effectiveness and generalizability.