arXiv reaDer
教師なし異常検出のための生徒と教師の機能ピラミッドマッチング
Student-Teacher Feature Pyramid Matching for Unsupervised Anomaly Detection
異常検出は困難な作業であり、通常、異常の予期しないことに対する教師なし学習問題として定式化されます。このホワイトペーパーでは、この問題に対するシンプルでありながら強力なアプローチを提案します。これは、その利点のために生徒と教師のフレームワークに実装されますが、精度と効率の両方の点で大幅に拡張されます。教師としての画像分類について事前にトレーニングされた強力なモデルを前提として、同じアーキテクチャを備えた単一の学生ネットワークに知識を抽出して、異常のない画像の分布を学習します。この1ステップの転送により、重要な手がかりが可能な限り保持されます。 。さらに、マルチスケールの特徴マッチング戦略をフレームワークに統合し、この階層的な特徴の配置により、学生ネットワークはより適切な監視の下で特徴ピラミッドからマルチレベルの知識の混合を受け取ることができるため、さまざまなサイズの異常を検出できます。 2つのネットワークによって生成された特徴ピラミッドの違いは、異常が発生する確率を示すスコアリング関数として機能します。このような操作により、私たちのアプローチは正確で高速なピクセルレベルの異常検出を実現します。非常に競争力のある結果が3つの主要なベンチマークで提供され、最先端のベンチマークよりも大幅に優れています。さらに、非常に高速(256x256のサイズの画像の場合は100 FPS)で推論を行い、最新の対応物よりも少なくとも数十倍高速です。
Anomaly detection is a challenging task and usually formulated as an unsupervised learning problem for the unexpectedness of anomalies. This paper proposes a simple yet powerful approach to this issue, which is implemented in the student-teacher framework for its advantages but substantially extends it in terms of both accuracy and efficiency. Given a strong model pre-trained on image classification as the teacher, we distill the knowledge into a single student network with the identical architecture to learn the distribution of anomaly-free images and this one-step transfer preserves the crucial clues as much as possible. Moreover, we integrate the multi-scale feature matching strategy into the framework, and this hierarchical feature alignment enables the student network to receive a mixture of multi-level knowledge from the feature pyramid under better supervision, thus allowing to detect anomalies of various sizes. The difference between feature pyramids generated by the two networks serves as a scoring function indicating the probability of anomaly occurring. Due to such operations, our approach achieves accurate and fast pixel-level anomaly detection. Very competitive results are delivered on three major benchmarks, significantly superior to the state of the art ones. In addition, it makes inferences at a very high speed (with 100 FPS for images of the size at 256x256), at least dozens of times faster than the latest counterparts.
updated: Mon Mar 15 2021 08:27:33 GMT+0000 (UTC)
published: Sun Mar 07 2021 04:25:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト