教師なし異常検出 (UAD) は、産業用および医療用アプリケーションで広く実装されており、手動注釈のコストを削減し、疾患診断の効率を向上させます。最近、バリアントを含むディープ オート エンコーダーは、多くの UAD シナリオでその利点を実証しています。正常なデータでトレーニングすると、これらのモデルは、正常な領域よりも異常な領域の再構成エラーが高くなるため、異常を特定することが期待されます。ただし、制御不能な一般化機能のため、この仮定が常に成り立つとは限りません。この問題を解決するために、LSGS を提示します。これは、Vector Quantized-Variational Autoencoder (VQVAE) に基づいて構築された方法であり、グローバルな注目を集めた新しい集約コードブックと変換器を備えています。この作業では、VQVAE は画像の特徴抽出と再構成に焦点を当てており、トランスフォーマーは多様体に適合し、潜在空間内の異常を特定します。次に、生成された正規分布に従うエンコード シーケンスを活用して、異常を特定するためのより正確な画像を再構築できます。さまざまなデータセットでの実験は、提案された方法の有効性を示しています。
Unsupervised anomaly detection (UAD) has been widely implemented in industrial and medical applications, which reduces the cost of manual annotation and improves efficiency in disease diagnosis. Recently, deep auto-encoder with its variants has demonstrated its advantages in many UAD scenarios. Training on the normal data, these models are expected to locate anomalies by producing higher reconstruction error for the abnormal areas than the normal ones. However, this assumption does not always hold because of the uncontrollable generalization capability. To solve this problem, we present LSGS, a method that builds on Vector Quantised-Variational Autoencoder (VQVAE) with a novel aggregated codebook and transformers with global attention. In this work, the VQVAE focus on feature extraction and reconstruction of images, and the transformers fit the manifold and locate anomalies in the latent space. Then, leveraging the generated encoding sequences that conform to a normal distribution, we can reconstruct a more accurate image for locating the anomalies. Experiments on various datasets demonstrate the effectiveness of the proposed method.