ディープネットワークは、トレーニング分布から遠く離れた外れ値データでテストすると、自信を持って、しかし不正確な予測を行うことがよくあります。深い生成モデルによって計算された尤度は、ラベルのないデータを使用した外れ値検出の候補メトリックです。しかし、以前の研究では、そのような可能性は信頼性が低く、入力データへの単純な変換によって簡単にバイアスがかかる可能性があることが示されています。ここでは、最も単純なクラスの深層生成モデルの中で、変分オートエンコーダー(VAE)を使用した外れ値の検出について検討します。まず、理論的に根拠のある補正が、VAEの可能性の推定値を使用して主要なバイアスを容易に改善することを示します。バイアス補正はモデルフリーでサンプル固有であり、ベルヌーイおよび連続ベルヌーイ可視分布を使用して正確に計算されます。次に、よく知られている前処理技術であるコントラストの正規化により、バイアス補正の効果が自然な画像データセットにまで拡張されることを示します。第3に、VAEのアンサンブルに対して計算された尤度の分散によって、ロバストな外れ値の検出も可能になることを示します。 9つの(グレースケールおよび自然の)画像データセットを使用して救済策の包括的な評価を実行し、速度と精度の両方の点で、他の4つの最先端の方法に比べて大きな利点を示しています。私たちの軽量な救済策は生物学的に着想を得ており、多くの種類の深い生成モデルで効率的な外れ値の検出を実現するのに役立つ可能性があります。
Deep networks often make confident, yet incorrect, predictions when tested with outlier data that is far removed from their training distributions. Likelihoods computed by deep generative models are a candidate metric for outlier detection with unlabeled data. Yet, previous studies have shown that such likelihoods are unreliable and can be easily biased by simple transformations to input data. Here, we examine outlier detection with variational autoencoders (VAEs), among the simplest class of deep generative models. First, we show that a theoretically-grounded correction readily ameliorates a key bias with VAE likelihood estimates. The bias correction is model-free, sample-specific, and accurately computed with the Bernoulli and continuous Bernoulli visible distributions. Second, we show that a well-known preprocessing technique, contrast normalization, extends the effectiveness of bias correction to natural image datasets. Third, we show that the variance of the likelihoods computed over an ensemble of VAEs also enables robust outlier detection. We perform a comprehensive evaluation of our remedies with nine (grayscale and natural) image datasets, and demonstrate significant advantages, in terms of both speed and accuracy, over four other state-of-the-art methods. Our lightweight remedies are biologically inspired and may serve to achieve efficient outlier detection with many types of deep generative models.