分布外 (OOD) 検出に関する多くの優れた研究では、モデルの信頼性を正則化するために、実際のまたは人工的に生成された外れ値データを使用しています。ただし、多くの場合、ベース ネットワークまたは特殊なモデル アーキテクチャの再トレーニングが必要になります。私たちの研究は、OOD オブジェクト検出の困難な分野で、Noisy Inliers Make Great Outliers (NIMGO) を示しています。 OOD サンプルを識別するディスクリミネーターをトレーニングするために、合成外れ値は分布内 (ID) データの最小限に摂動されたバリアントのみである必要があるという仮説を立てています。仮説を検証するために、イメージまたはバウンディング ボックス レベルで ID サンプルに加法的ノイズ摂動を適用することにより、合成外れ値セットを生成します。次に、摂動した ID サンプルをプロキシとして使用して、OOD 特徴表現を検出するように、多層パーセプトロン (MLP) を監視する補助特徴をトレーニングします。テスト中に、補助 MLP が ID サンプルと OOD サンプルを最先端レベルで区別し、偽陽性率を以前の最先端技術よりも 20% (絶対) 以上削減することを実証しました。 OpenImages データセット。広範な追加のアブレーションは、仮説を支持する経験的証拠を提供します。
Many high-performing works on out-of-distribution (OOD) detection use real or synthetically generated outlier data to regularise model confidence; however, they often require retraining of the base network or specialised model architectures. Our work demonstrates that Noisy Inliers Make Great Outliers (NIMGO) in the challenging field of OOD object detection. We hypothesise that synthetic outliers need only be minimally perturbed variants of the in-distribution (ID) data in order to train a discriminator to identify OOD samples -- without expensive retraining of the base network. To test our hypothesis, we generate a synthetic outlier set by applying an additive-noise perturbation to ID samples at the image or bounding-box level. An auxiliary feature monitoring multilayer perceptron (MLP) is then trained to detect OOD feature representations using the perturbed ID samples as a proxy. During testing, we demonstrate that the auxiliary MLP distinguishes ID samples from OOD samples at a state-of-the-art level, reducing the false positive rate by more than 20% (absolute) over the previous state-of-the-art on the OpenImages dataset. Extensive additional ablations provide empirical evidence in support of our hypothesis.