arXiv reaDer
単純な近隣代表の前処理が外れ値検出器を後押し
Simple Neighborhood Representative Pre-processing Boosts Outlier Detectors
何十年にもわたって、従来の外れ値検出器は、オブジェクトレベルの係数のみを評価することによってデータ内のオブジェクトの外れ値スコアを計算するときにグループレベルの係数を無視し、集合的な外れ値をキャプチャできませんでした。この問題を軽減するために、近隣代表(NR)と呼ばれる方法を紹介します。これにより、既存のすべての外れ値検出器が、計算の整合性を維持しながら、集合的な外れ値を含む外れ値を効率的に検出できるようになります。これは、代表的なオブジェクトを選択し、これらのオブジェクトにスコアを付けてから、代表的なオブジェクトのスコアをその集合的なオブジェクトに適用することによって実現されます。既存の検出器を変更することなく、NRは既存の検出器と互換性があり、最新の外れ値検出器と比較して+ 8%(0.72〜0.78 AUC)の実世界のデータセットでのパフォーマンスを向上させます。
Over the decades, traditional outlier detectors have ignored the group-level factor when calculating outlier scores for objects in data by evaluating only the object-level factor, failing to capture the collective outliers. To mitigate this issue, we present a method called neighborhood representative (NR), which empowers all the existing outlier detectors to efficiently detect outliers, including collective outliers, while maintaining their computational integrity. It achieves this by selecting representative objects, scoring these objects, then applies the score of the representative objects to its collective objects. Without altering existing detectors, NR is compatible with existing detectors, while improving performance on real world datasets with +8% (0.72 to 0.78 AUC) relative to state-of-the-art outlier detectors.
updated: Sun Nov 21 2021 04:58:51 GMT+0000 (UTC)
published: Sun Oct 11 2020 21:31:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト