arXiv reaDer
EfficientAD: ミリ秒レベルのレイテンシでの正確な視覚的異常検出
EfficientAD: Accurate Visual Anomaly Detection at Millisecond-Level Latencies
画像の異常を検出することは、特にリアルタイムのコンピューター ビジョン アプリケーションでは重要なタスクです。この作業では、計算効率に焦点を当て、最新の GPU で 1 ミリ秒未満で画像を処理する軽量の特徴抽出器を提案します。次に、生徒と教師のアプローチを使用して、異常な機能を検出します。通常の、つまり異常のないトレーニング画像の抽出された特徴を予測するようにスチューデント ネットワークをトレーニングします。テスト時の異常の検出は、学生が自分の特徴を予測できないことによって可能になります。学生が通常の画像を超えて教師の特徴抽出器を模倣するのを妨げるトレーニング損失を提案します。これにより、異常な特徴の検出を改善しながら、学生教師モデルの計算コストを大幅に削減できます。さらに、通常のローカル機能の無効な組み合わせ (オブジェクトの順序の誤りなど) を伴う困難な論理異常の検出にも対処します。画像をグローバルに分析するオートエンコーダーを効率的に組み込むことで、これらの異常を検出します。 3 つの産業異常検出データセット コレクションからの 32 のデータセットで、EfficientAD と呼ばれる方法を評価します。 EfficientAD は、異常の検出とローカリゼーションの両方に新しい基準を設定します。 2 ミリ秒のレイテンシーと 1 秒あたり 600 枚の画像のスループットで、異常を迅速に処理できます。エラー率が低いことと相まって、これは実世界のアプリケーションにとって経済的なソリューションであり、将来の研究にとって有益な基盤となります。
Detecting anomalies in images is an important task, especially in real-time computer vision applications. In this work, we focus on computational efficiency and propose a lightweight feature extractor that processes an image in less than a millisecond on a modern GPU. We then use a student-teacher approach to detect anomalous features. We train a student network to predict the extracted features of normal, i.e., anomaly-free training images. The detection of anomalies at test time is enabled by the student failing to predict their features. We propose a training loss that hinders the student from imitating the teacher feature extractor beyond the normal images. It allows us to drastically reduce the computational cost of the student-teacher model, while improving the detection of anomalous features. We furthermore address the detection of challenging logical anomalies that involve invalid combinations of normal local features, for example, a wrong ordering of objects. We detect these anomalies by efficiently incorporating an autoencoder that analyzes images globally. We evaluate our method, called EfficientAD, on 32 datasets from three industrial anomaly detection dataset collections. EfficientAD sets new standards for both the detection and the localization of anomalies. At a latency of two milliseconds and a throughput of six hundred images per second, it enables a fast handling of anomalies. Together with its low error rate, this makes it an economical solution for real-world applications and a fruitful basis for future research.
updated: Thu Feb 08 2024 18:38:30 GMT+0000 (UTC)
published: Sat Mar 25 2023 18:48:33 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト