arXiv reaDer
汎用マルチモーダル OOD 検出フレームワーク
General-Purpose Multi-Modal OOD Detection Framework
分布外 (OOD) 検出は、トレーニング データとは異なるテスト サンプルを特定します。これは、機械学習 (ML) システムの安全性と信頼性を確保するために重要です。ユニモーダル OOD サンプルを検出するために多数の方法が開発されていますが、マルチモーダル OOD 検出に焦点を当てた方法はほんのわずかです。現在の対比学習ベースの手法は主に、特定の画像とそれに対応するテキスト記述の両方が新しいドメインから取得されるシナリオでのマルチモーダル OOD 検出を研究します。ただし、ML システムの実際の展開では、センサーの故障、悪天候、環境の変化などの複数の要因によって引き起こされる、より多くの異常シナリオに直面する可能性があります。したがって、この作業の目標は、複数の異なる OOD シナリオからきめ細かい方法で同時に検出することです。この目標を達成するために、バイナリ分類器と対照学習コンポーネントを組み合わせて両方のメリットを享受する、WOOD と呼ばれる汎用の弱教師 OOD 検出フレームワークを提案します。インディストリビューション (ID) サンプルと OOD サンプルの潜在表現をより適切に区別するために、ヒンジ損失を採用してそれらの類似性を制限します。さらに、OOD サンプルを識別するためのバイナリ分類器と対照学習の両方からの予測結果を統合するための新しいスコアリング メトリックを開発します。提案された WOOD モデルを複数の実世界のデータセットで評価したところ、実験結果は、WOOD モデルがマルチモーダル OOD 検出の最先端の方法よりも優れていることを示しました。重要なのは、私たちのアプローチは 3 つの異なる OOD シナリオで同時に高精度の OOD 検出を達成できることです。ソースコードは公開と同時に公開されます。
Out-of-distribution (OOD) detection identifies test samples that differ from the training data, which is critical to ensuring the safety and reliability of machine learning (ML) systems. While a plethora of methods have been developed to detect uni-modal OOD samples, only a few have focused on multi-modal OOD detection. Current contrastive learning-based methods primarily study multi-modal OOD detection in a scenario where both a given image and its corresponding textual description come from a new domain. However, real-world deployments of ML systems may face more anomaly scenarios caused by multiple factors like sensor faults, bad weather, and environmental changes. Hence, the goal of this work is to simultaneously detect from multiple different OOD scenarios in a fine-grained manner. To reach this goal, we propose a general-purpose weakly-supervised OOD detection framework, called WOOD, that combines a binary classifier and a contrastive learning component to reap the benefits of both. In order to better distinguish the latent representations of in-distribution (ID) and OOD samples, we adopt the Hinge loss to constrain their similarity. Furthermore, we develop a new scoring metric to integrate the prediction results from both the binary classifier and contrastive learning for identifying OOD samples. We evaluate the proposed WOOD model on multiple real-world datasets, and the experimental results demonstrate that the WOOD model outperforms the state-of-the-art methods for multi-modal OOD detection. Importantly, our approach is able to achieve high accuracy in OOD detection in three different OOD scenarios simultaneously. The source code will be made publicly available upon publication.
updated: Mon Jul 24 2023 18:50:49 GMT+0000 (UTC)
published: Mon Jul 24 2023 18:50:49 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト