教師なし異常検出の本質は、正常なサンプルのコンパクトな分布を学習し、テストで異常値を異常として検出することです。一方、現実世界の異常は通常、特に産業用アプリケーションの場合、高解像度画像では微妙で細かくなります。この目的に向けて、教師なし異常の検出とローカリゼーションのための新しいフレームワークを提案します。私たちの方法は、粗いものから細かいものへの位置合わせプロセスを使用して、通常の画像から高密度でコンパクトな分布を学習することを目的としています。粗調整段階では、画像レベルと特徴レベルの両方でオブジェクトのピクセル単位の位置が標準化されます。次に、微調整段階により、バッチ内の対応するすべての場所間の特徴の類似性が密に最大化されます。通常の画像のみで学習を容易にするために、ファインアラインメント段階での非対照学習と呼ばれる新しい口実タスクを提案します。非対照学習は、異常なサンプルを想定することなく、堅牢で識別力のある正常な画像表現を抽出します。これにより、モデルがさまざまな異常なシナリオに一般化できるようになります。 MVTecADとBenTechADの2つの典型的な産業データセットに関する広範な実験は、私たちのフレームワークがさまざまな現実世界の欠陥を検出するのに効果的であり、産業の教師なし異常検出の新しい最先端を達成することを示しています。
The essence of unsupervised anomaly detection is to learn the compact distribution of normal samples and detect outliers as anomalies in testing. Meanwhile, the anomalies in real-world are usually subtle and fine-grained in a high-resolution image especially for industrial applications. Towards this end, we propose a novel framework for unsupervised anomaly detection and localization. Our method aims at learning dense and compact distribution from normal images with a coarse-to-fine alignment process. The coarse alignment stage standardizes the pixel-wise position of objects in both image and feature levels. The fine alignment stage then densely maximizes the similarity of features among all corresponding locations in a batch. To facilitate the learning with only normal images, we propose a new pretext task called non-contrastive learning for the fine alignment stage. Non-contrastive learning extracts robust and discriminating normal image representations without making assumptions on abnormal samples, and it thus empowers our model to generalize to various anomalous scenarios. Extensive experiments on two typical industrial datasets of MVTec AD and BenTech AD demonstrate that our framework is effective in detecting various real-world defects and achieves a new state-of-the-art in industrial unsupervised anomaly detection.