arXiv reaDer
外れ値を検出するために、ドメイン内のデータから表現を学習する必要が本当にありますか?
Do We Really Need to Learn Representations from In-domain Data for Outlier Detection?
テストサンプルが外れ値であるかどうか、またはラベルのないインライアデータからの情報のみを使用していないかどうかを予測する教師なし外れ値検出は、重要ですが困難なタスクです。最近、2段階のフレームワークに基づく方法が、このタスクで最先端のパフォーマンスを実現しています。このフレームワークは、自己教師あり表現学習アルゴリズムを活用して、インライアデータで特徴抽出器をトレーニングし、特徴空間に単純な外れ値検出器を適用します。このホワイトペーパーでは、外れ値検出タスクごとに個別の表現をトレーニングするコストが高くなることを回避し、代わりに、ドメイン内データのソースに関係なく、事前にトレーニングされた単一のネットワークをユニバーサル特徴抽出器として使用する可能性を探ります。特に、タスク固有の特徴抽出器を、ImageNetで事前にトレーニングされた1つのネットワークに置き換え、自己監視損失を使用します。実験では、以前の2段階の方法と比較して、さまざまな外れ値検出ベンチマークで競合またはより優れたパフォーマンスを示し、ドメイン内データからの表現の学習が外れ値検出に不要である可能性があることを示唆しています。
Unsupervised outlier detection, which predicts if a test sample is an outlier or not using only the information from unlabelled inlier data, is an important but challenging task. Recently, methods based on the two-stage framework achieve state-of-the-art performance on this task. The framework leverages self-supervised representation learning algorithms to train a feature extractor on inlier data, and applies a simple outlier detector in the feature space. In this paper, we explore the possibility of avoiding the high cost of training a distinct representation for each outlier detection task, and instead using a single pre-trained network as the universal feature extractor regardless of the source of in-domain data. In particular, we replace the task-specific feature extractor by one network pre-trained on ImageNet with a self-supervised loss. In experiments, we demonstrate competitive or better performance on a variety of outlier detection benchmarks compared with previous two-stage methods, suggesting that learning representations from in-domain data may be unnecessary for outlier detection.
updated: Wed May 19 2021 17:30:28 GMT+0000 (UTC)
published: Wed May 19 2021 17:30:28 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト