arXiv reaDer
Dual-Attention Transformer と弁別フローによる視覚的異常検出
Visual Anomaly Detection via Dual-Attention Transformer and Discriminative Flow
このホワイト ペーパーでは、視覚的異常検出のための新しい最先端の Dual-Attention Transformer and Discriminative Flow (DADF) フレームワークを紹介します。通常の知識のみに基づいて、視覚的な異常検出は産業シナリオで幅広い用途があり、大きな注目を集めています。ただし、ほとんどの既存の方法は要件を満たしていません。対照的に、提案された DTDF は新しいパラダイムを提示します。まず、事前にトレーニングされたネットワークを活用してマルチスケールの事前埋め込みを取得し、続いて二重の注意メカニズム、つまり自己注意と記念注意を備えたビジョン トランスフォーマーを開発します。シーケンシャルおよび正規性の関連付けを使用して、以前の埋め込みの 2 レベルの再構成を実現します。さらに、正規化フローを使用して、各スケールでの事前分布と再構成の結合分布の識別可能性を確立することを提案します。 DADF は、Mvtec AD で 98.3/98.4 の画像/ピクセル AUROC を達成します。 Mvtec LOCO AD ベンチマークでの画像 AUROC の 83.7 とピクセル sPRO の 67.4 は、提案されたアプローチの有効性を示しています。
In this paper, we introduce the novel state-of-the-art Dual-attention Transformer and Discriminative Flow (DADF) framework for visual anomaly detection. Based on only normal knowledge, visual anomaly detection has wide applications in industrial scenarios and has attracted significant attention. However, most existing methods fail to meet the requirements. In contrast, the proposed DTDF presents a new paradigm: it firstly leverages a pre-trained network to acquire multi-scale prior embeddings, followed by the development of a vision Transformer with dual attention mechanisms, namely self-attention and memorial-attention, to achieve two-level reconstruction for prior embeddings with the sequential and normality association. Additionally, we propose using normalizing flow to establish discriminative likelihood for the joint distribution of prior and reconstructions at each scale. The DADF achieves 98.3/98.4 of image/pixel AUROC on Mvtec AD; 83.7 of image AUROC and 67.4 of pixel sPRO on Mvtec LOCO AD benchmarks, demonstrating the effectiveness of our proposed approach.
updated: Fri Mar 31 2023 08:34:07 GMT+0000 (UTC)
published: Fri Mar 31 2023 08:34:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト