arXiv reaDer
ベクトル量子化変分オートエンコーダを使用した潜在空間復元による異常検出
Anomaly detection through latent space restoration using vector-quantized variational autoencoders
ベクトル量子化変分オートエンコーダー(VQ-VAE)を使用して、密度と復元ベースのアプローチを組み合わせた分布外検出方法を提案します。 VQ-VAEモデルは、カテゴリカル潜在空間で画像をエンコードすることを学習します。次に、潜在コードの事前分布は、自己回帰(AR)モデルを使用してモデル化されます。 ARモデルによって推定された事前確率は、教師なし異常検出に役立ち、サンプルとピクセル単位の両方の異常スコアの推定を可能にすることがわかりました。サンプルごとのスコアは、可能性が非常に低いコードを選択するしきい値を超える潜在変数の負の対数尤度として定義されます。さらに、分布外の画像は、ありそうもない潜在的なコードを前のモデルからのサンプルに置き換え、ピクセル空間にデコードすることによって、分布内の画像に復元されます。生成された修復物と元の画像の間の平均L1距離は、ピクセル単位の異常スコアとして使用されます。 MOODチャレンジデータセットでアプローチをテストし、VAEを使用した標準的な再構築ベースのアプローチと比較して高い精度を報告します。
We propose an out-of-distribution detection method that combines density and restoration-based approaches using Vector-Quantized Variational Auto-Encoders (VQ-VAEs). The VQ-VAE model learns to encode images in a categorical latent space. The prior distribution of latent codes is then modelled using an Auto-Regressive (AR) model. We found that the prior probability estimated by the AR model can be useful for unsupervised anomaly detection and enables the estimation of both sample and pixel-wise anomaly scores. The sample-wise score is defined as the negative log-likelihood of the latent variables above a threshold selecting highly unlikely codes. Additionally, out-of-distribution images are restored into in-distribution images by replacing unlikely latent codes with samples from the prior model and decoding to pixel space. The average L1 distance between generated restorations and original image is used as pixel-wise anomaly score. We tested our approach on the MOOD challenge datasets, and report higher accuracies compared to a standard reconstruction-based approach with VAEs.
updated: Sat Dec 12 2020 09:19:59 GMT+0000 (UTC)
published: Sat Dec 12 2020 09:19:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト