arXiv reaDer
視覚的異常検出のためのオートエンコーダーを使用した自己教師ありトレーニング
Self-Supervised Training with Autoencoders for Visual Anomaly Detection
ディープ畳み込みオートエンコーダーは、教師なしの方法で非線形次元削減を学習するための効果的なツールを提供します。最近では、視覚領域での異常検出のタスクに使用されています。異常のない例を使用して再構成エラーを最適化すると、対応するネットワークはアプリケーション段階で異常な領域を正確に再構成できないはずである、というのが一般的な考えです。この目標は通常、ボトルネック層のサイズを縮小するか、そのアクティブ化にスパース性制約を適用することでネットワークの容量を制御することで解決されます。ただし、これらの手法はどちらも、検出が不十分になることが多い異常な信号の再構成を明示的に罰するものではありません。我々は、自己教師あり学習体制を適応させることでこの問題に取り組みます。これにより、修正された再構成誤差によってデータ多様体に焦点を当てたトレーニング中に識別情報を使用できるようになります。これによりモデルが正規化され、局所的に一貫した再構成が生成されると同時に、異常なパターンのフィルターとして機能することで不規則性が置き換えられます。関連するアプローチとは対照的に、私たちの方法による推論は、入力画像全体を 1 つのステップでトレーニングおよび予測処理する際に非常に効率的です。 MVTec AD データセットでの実験では、提案された方法の高い認識および位置特定パフォーマンスが実証されました。特にテクスチャ サブセットに関しては、私たちのアプローチは、最近の一連の異常検出手法を常に大幅に上回っています。
Deep convolutional autoencoders provide an effective tool for learning non-linear dimensionality reduction in an unsupervised way. Recently, they have been used for the task of anomaly detection in the visual domain. By optimising for the reconstruction error using anomaly-free examples, the common belief is that a corresponding network should fail to accurately reconstruct anomalous regions in the application phase. This goal is typically addressed by controlling the capacity of the network by either reducing the size of the bottleneck layer or enforcing sparsity constraints on its activations. However, neither of these techniques does explicitly penalize reconstruction of anomalous signals often resulting in poor detection. We tackle this problem by adapting a self-supervised learning regime, which allows to use discriminative information during training focusing on the data manifold by means of a modified reconstruction error. This regularizes the model to produce locally consistent reconstructions, while replacing irregularities by acting as a filter for anomalous patterns. In contrast to related approaches, inference with our method is very efficient during training and prediction processing the entire input image in one single step. Our experiments on the MVTec AD dataset demonstrate high recognition and localization performance of the proposed method. On the texture-subset, in particular, our approach consistently outperforms a bunch of recent anomaly detection methods by a big margin.
updated: Wed Jun 14 2023 23:33:53 GMT+0000 (UTC)
published: Thu Jun 23 2022 14:16:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト