画像検索における不確実性の定量化は、下流の意思決定にとって重要ですが、それでも、挑戦的で、ほとんど未踏の問題のままです。不確実性を推定するための現在の方法は、不十分に較正されているか、計算コストが高いか、またはヒューリスティックに基づいています。画像の埋め込みを決定論的特徴ではなく確率的特徴として見る新しい方法を提示します。私たちの2つの主な貢献は、(1)トリプレット制約に一致する可能性と、アンカーが負よりも正に近い確率を評価する可能性です。 (2)従来のl2正規化を正当化する特徴空間に対する優先順位。計算効率を確保するために、ベイズトリプレット損失と呼ばれる事後の変分近似を導出します。これは、最先端の不確実性推定値を生成し、現在の最先端の方法の予測パフォーマンスと一致します。
Uncertainty quantification in image retrieval is crucial for downstream decisions, yet it remains a challenging and largely unexplored problem. Current methods for estimating uncertainties are poorly calibrated, computationally expensive, or based on heuristics. We present a new method that views image embeddings as stochastic features rather than deterministic features. Our two main contributions are (1) a likelihood that matches the triplet constraint and that evaluates the probability of an anchor being closer to a positive than a negative; and (2) a prior over the feature space that justifies the conventional l2 normalization. To ensure computational efficiency, we derive a variational approximation of the posterior, called the Bayesian triplet loss, that produces state-of-the-art uncertainty estimates and matches the predictive performance of current state-of-the-art methods.