標準的な機械学習は、トレーニング分布に属さない入力に対応できません。結果として得られるモデルは、多くの場合、壊滅的な結果につながる可能性のある、確信を持って間違った予測を生み出します。入力画像が部分的にのみ異常である可能性があるため、この問題は、密な予測のコンテキストにおいて特に要求が厳しくなります。これまでの研究では、既製のネガティブ データセットに関する判別トレーニングによる高密度の分布外検出に取り組んできました。ただし、実際のネガティブ データが視覚世界全体のすべてのモードをカバーしている可能性は低いです。この目的を達成するために、内層多様体の境界に沿って合成ネガティブ パッチを生成することで、このアプローチを拡張します。カバレッジ指向の学習目標と、さまざまな解像度でサンプルを生成する機能により、共同でトレーニングされた正規化フローを活用します。私たちは、トレーニングと推論を通じて一貫して適用できる、原則に基づいた情報理論的基準に従って異常を検出します。結果として得られるモデルは、最小限の計算オーバーヘッドにもかかわらず、道路走行シーンやリモート センシング画像における分布外検出のベンチマークにおける新しい最先端技術を確立します。
Standard machine learning is unable to accommodate inputs which do not belong to the training distribution. The resulting models often give rise to confident incorrect predictions which may lead to devastating consequences. This problem is especially demanding in the context of dense prediction since input images may be only partially anomalous. Previous work has addressed dense out-of-distribution detection by discriminative training with respect to off-the-shelf negative datasets. However, real negative data are unlikely to cover all modes of the entire visual world. To this end, we extend this approach by generating synthetic negative patches along the border of the inlier manifold. We leverage a jointly trained normalizing flow due to coverage-oriented learning objective and the capability to generate samples at different resolutions. We detect anomalies according to a principled information-theoretic criterion which can be consistently applied through training and inference. The resulting models set the new state of the art on benchmarks for out-of-distribution detection in road-driving scenes and remote sensing imagery, in spite of minimal computational overhead.