arXiv reaDer
MOCCA:異常検出のための多層1クラス分類
MOCCA: Multi-Layer One-Class ClassificAtion for Anomaly Detection
異常はすべての科学分野に遍在しており、データ分布に関する知識が不完全であるか、突然作用して観測を歪める未知のプロセスが原因で、予期しないイベントを表す可能性があります。このようなイベントはまれであるため、「通常の」、つまり異常ではないデータセットのみで深層学習モデルをトレーニングするのが一般的です。これにより、ニューラルネットワークで入力データの下の分布をモデル化できます。これに関連して、Multi-LayerOne-Class Classification(MOCCA)という名前の異常検出問題に対する深層学習アプローチを提案します。さまざまな深度で抽出された情報を活用して異常なデータインスタンスを検出することにより、ディープニューラルネットワークの区分的性質を明示的に活用します。モデルの複数のレイヤーから抽出された表現を組み合わせると、ニューラルネットワークの最終出力のみに基づく文献で提案されている一般的なアプローチよりも高い識別パフォーマンスが得られることを示します。入力表現と参照点(異常のないトレーニングデータ重心)の間のL_2距離を、考慮される各レイヤーで最小化することにより、モデルをトレーニングすることを提案します。単一画像とビデオベースの両方のシナリオを考慮して、異常検出用に公開されているデータセット、つまりCIFAR10、MVTec AD、ShanghaiTechで広範な実験を実施します。私たちの方法は、文献で利用可能な最先端のアプローチと比較して優れたパフォーマンスに到達することを示しています。さらに、モデル分析を提供して、アプローチがどのように機能するかについての洞察を提供します。
Anomalies are ubiquitous in all scientific fields and can express an unexpected event due to incomplete knowledge about the data distribution or an unknown process that suddenly comes into play and distorts the observations. Due to such events' rarity, it is common to train deep learning models on "normal", i.e. non-anomalous, datasets only, thus letting the neural network to model the distribution beneath the input data. In this context, we propose our deep learning approach to the anomaly detection problem named Multi-LayerOne-Class Classification (MOCCA). We explicitly leverage the piece-wise nature of deep neural networks by exploiting information extracted at different depths to detect abnormal data instances. We show how combining the representations extracted from multiple layers of a model leads to higher discrimination performance than typical approaches proposed in the literature that are based neural networks' final output only. We propose to train the model by minimizing the L_2 distance between the input representation and a reference point, the anomaly-free training data centroid, at each considered layer. We conduct extensive experiments on publicly available datasets for anomaly detection, namely CIFAR10, MVTec AD, and ShanghaiTech, considering both the single-image and video-based scenarios. We show that our method reaches superior performances compared to the state-of-the-art approaches available in the literature. Moreover, we provide a model analysis to give insight on how our approach works.
updated: Mon Apr 05 2021 09:40:17 GMT+0000 (UTC)
published: Wed Dec 09 2020 08:32:56 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト