異常検出とは、さまざまな分野で活発な研究が行われている正常なパターンから逸脱した観測を特定することです。最近、データスケール、複雑さ、および次元の増加により、従来の表現と統計ベースの外れ値検出方法が困難になっています。この論文では、ハイパースペクトル画像の異常検出において生成モデルを活用します。要点は、正規データの分布をモデル化することですが、分布外のサンプルは外れ値と見なすことができます。最初に、変分推論に基づく異常検出方法が調査されます。理論的および経験的に、正則化として機能する距離(f-divergence)の強い概念のために、それらは不安定であることがわかります。次に、この論文では、スライスされたワッサースタイン距離を紹介します。これは、f-divergenceと比較して弱い分布測度です。ただし、ランダムにスライスする数は、実際の距離を推定するのが困難です。最後に、投影スライスワッサースタイン(PSW)オートエンコーダベースの異常スクリーニング法を提案します。特に、計算に適した固有分解法を利用して、高次元データをスライスする主成分を見つけます。さらに、事前分布がガウス分布でなくても、提案された距離は閉じた形で計算できます。さまざまな実世界のハイパースペクトル異常検出ベンチマークで実施された包括的な実験は、提案された方法の優れたパフォーマンスを示しています。
Anomaly detection refers to identifying the observation that deviates from the normal pattern, which has been an active research area in various domains. Recently, the increasing data scale, complexity, and dimension turns the traditional representation and statistical-based outlier detection method into challenging. In this paper, we leverage the generative model in hyperspectral images anomaly detection. The gist is to model the distribution of the normal data, while the out-of-distribution sample can be viewed as the outlier. At first, the variational inference-based anomaly detection methods are investigated. We theoretically and empirically find that they are unstable due to the strong notion of distance (f-divergence) served as the regularization. Secondly, this paper introduces sliced Wasserstein distance, which is a weaker distribution measure compared with f-divergence. However, the number of randomly slicing poses a difficulty to estimate the true distance. In the end, we propose a projected sliced Wasserstein (PSW) autoencoder-based anomaly screening method. In particular, we leverage a computation-friendly eigen-decomposition method to find the principal component as slicing the high-dimensional data. Furthermore, our proposed distance can be calculated with the closed-form, even the prior distribution is not Gaussian. Comprehensive experiments conducted on various real-world hyperspectral anomaly detection benchmarks demonstrate the superior performance of our proposed method.