異常検出への再構築ベースのアプローチは、クラス間の分散が高いターゲットクラスを持つ複雑なデータセットに適用すると不十分になる傾向があります。転移学習で使用される独学学習の考え方と同様に、多くのドメインには、配布外のサンプルのプロキシとして利用できる同様のラベルのないデータセットが豊富にあります。この論文では、同様のドメインからのラベルのないデータをネガティブな例として利用して、通常のオートエンコーダの潜在層(ボトルネック)を1つのタスクしか再構築できないように形成する、潜在性に依存しないオートエンコーダ(LIS-AE)を紹介します。モデルの重要な側面に焦点を当てた広範なアブレーション研究とともに、提案されたトレーニングプロセスと損失関数の理論的正当化を提供します。複数の異常検出設定でモデルをテストし、定量的および定性的な分析を提示して、異常検出タスクのモデルのパフォーマンスが大幅に向上していることを示します。
Reconstruction-based approaches to anomaly detection tend to fall short when applied to complex datasets with target classes that possess high inter-class variance. Similar to the idea of self-taught learning used in transfer learning, many domains are rich with similar unlabelled datasets that could be leveraged as a proxy for out-of-distribution samples. In this paper we introduce Latent-Insensitive autoencoder (LIS-AE) where unlabeled data from a similar domain is utilized as negative examples to shape the latent layer (bottleneck) of a regular autoencoder such that it is only capable of reconstructing one task. We provide theoretical justification for the proposed training process and loss functions along with an extensive ablation study highlighting important aspects of our model. We test our model in multiple anomaly detection settings presenting quantitative and qualitative analysis showcasing the significant performance improvement of our model for anomaly detection tasks.