異常検出は、産業オートメーションや製造インテリジェンスなど、実際の多くのシナリオで極めて重要な役割を果たします。最近、変分推論に基づく異常分析が研究者や開発者の注目を集めています。これは、異常が分布外のサンプルとして分類できるように、欠陥のない分布をモデル化することを目的としています。それにもかかわらず、優先順位を付ける必要がある2つの不穏な要因があります。(i)制限された表現能力を誘発する単純な事前潜在分布。 (ii)強い確率距離の概念は、崩壊した特徴をもたらします。この論文では、これらの課題を軽減するために、新しいパッチワイズワッサースタインオートエンコーダ(P-WAE)アーキテクチャを提案します。特に、ジグソーパズルの解法と組み合わせたパッチごとの変分推論モデルが設計されています。これは、潜在多様体の表現力を高めるためのシンプルで効果的な方法です。これにより、高次元の実用データでモデルを使用することが可能になります。さらに、より弱い測定値であるスライスされたワッサースタイン距離を利用して、再構成の忠実度と一般化された表現の間の平衡を達成します。 MVTec ADデータセットで実施された包括的な実験は、提案された方法の優れたパフォーマンスを示しています。
Anomaly detection plays a pivotal role in numerous real-world scenarios, such as industrial automation and manufacturing intelligence. Recently, variational inference-based anomaly analysis has attracted researchers' and developers' attention. It aims to model the defect-free distribution so that anomalies can be classified as out-of-distribution samples. Nevertheless, there are two disturbing factors that need us to prioritize: (i) the simplistic prior latent distribution inducing limited expressive capability; (ii) the strong probability distance notion results in collapsed features. In this paper, we propose a novel Patch-wise Wasserstein AutoEncoder (P-WAE) architecture to alleviate those challenges. In particular, a patch-wise variational inference model coupled with solving the jigsaw puzzle is designed, which is a simple yet effective way to increase the expressiveness of the latent manifold. This makes using the model on high-dimensional practical data possible. In addition, we leverage a weaker measure, sliced-Wasserstein distance, to achieve the equilibrium between the reconstruction fidelity and generalized representations. Comprehensive experiments, conducted on the MVTec AD dataset, demonstrate the superior performance of our proposed method.