異常の検出は、異常を特定して修正する必要がある分野(医学や金融など)で非常に重要です。このタスクのディープラーニングメソッドは、オートエンコーダの再構築エラーに依存することが多く、他のエラーと組み合わせて使用されることもあります。このアプローチは、望ましくない結果につながる本質的なバイアスを示すことを示します。再構築ベースの方法は、トレーニングデータの外れ値と再構築が簡単なポイントに敏感です。代わりに、これらのバイアスの影響を受けない新しい監視なしのリプシッツ異常弁別器を紹介します。私たちの異常判別器は、トレーニングデータとトレーニングデータの破損の違いを検出するために、GANで使用されているものと同様にトレーニングされています。この手順により、目に見えない異常が正常に検出され、データから特定のヴァッサースタインの距離があるか、またはトレーニングセットが破損していることが保証されます。これらの追加により、MNIST、CIFAR10、およびヘルスレコードデータのパフォーマンスの向上を示すことができます。
Anomaly detection is of great interest in fields where abnormalities need to be identified and corrected (e.g., medicine and finance). Deep learning methods for this task often rely on autoencoder reconstruction error, sometimes in conjunction with other errors. We show that this approach exhibits intrinsic biases that lead to undesirable results. Reconstruction-based methods are sensitive to training-data outliers and simple-to-reconstruct points. Instead, we introduce a new unsupervised Lipschitz anomaly discriminator that does not suffer from these biases. Our anomaly discriminator is trained, similar to the ones used in GANs, to detect the difference between the training data and corruptions of the training data. We show that this procedure successfully detects unseen anomalies with guarantees on those that have a certain Wasserstein distance from the data or corrupted training set. These additions allow us to show improved performance on MNIST, CIFAR10, and health record data.