arXiv reaDer
同時エンコーダトレーニングを使用した汚染画像データからの異常検出の教師なし学習
Unsupervised Learning of Anomaly Detection from Contaminated Image Data using Simultaneous Encoder Training
 画像などの高次元データの異常検出の教師なし学習は、最近、集中的な研究が行われている挑戦的な問題です。通常のサンプルのデータ分布を慎重にモデリングすることにより、異常と呼ばれる逸脱したサンプルを検出することができます。生成的敵対ネットワーク(GAN)は、通常の画像サンプルの非常に複雑で高次元のデータ分布をモデル化でき、問題への適切なアプローチであることが示されています。以前に公開されたGANベースの異常検出方法は、多くの場合、異常のないデータがトレーニングに利用可能であると想定しています。ただし、この仮定は、ほとんどの現実のシナリオでは有効ではありません。この作業では、最新のGANベースの異常検出方法に関するトレーニングデータの異常汚染の影響を評価します。予想どおり、検出性能は低下します。このパフォーマンスの低下に対処するために、トレーニング時に既にエンコーダネットワークを追加し、ジェネレータとエンコーダのジョイントトレーニングが潜在空間を階層化し、汚染されたデータの問題を軽減することを示すことを提案します。この層化された潜在空間におけるクエリ画像のノルムが、異常を通常のデータから区別するための非常に重要なキューになることを実験的に示します。提案された方法は、CIFAR-10およびセルイメージを使用した未テストの大規模なデータセットで最先端のパフォーマンスを実現します。
Unsupervised learning of anomaly detection in high-dimensional data, such as images, is a challenging problem recently subject to intense research. Through careful modelling of the data distribution of normal samples, it is possible to detect deviant samples, so called anomalies. Generative Adversarial Networks (GANs) can model the highly complex, high-dimensional data distribution of normal image samples, and have shown to be a suitable approach to the problem. Previously published GAN-based anomaly detection methods often assume that anomaly-free data is available for training. However, this assumption is not valid in most real-life scenarios, a.k.a. in the wild. In this work, we evaluate the effects of anomaly contaminations in the training data on state-of-the-art GAN-based anomaly detection methods. As expected, detection performance deteriorates. To address this performance drop, we propose to add an additional encoder network already at training time and show that joint generator-encoder training stratifies the latent space, mitigating the problem with contaminated data. We show experimentally that the norm of a query image in this stratified latent space becomes a highly significant cue to discriminate anomalies from normal data. The proposed method achieves state-of-the-art performance on CIFAR-10 as well as on a large, previously untested dataset with cell images.
updated: Wed Nov 20 2019 12:49:09 GMT+0000 (UTC)
published: Mon May 27 2019 08:22:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト