arXiv reaDer
より良い画像テキスト モデルのためのサンプル固有のバイアス緩和
Sample-Specific Debiasing for Better Image-Text Models
画像テキスト データの自己教師あり表現学習により、画像分類、視覚的グラウンディング、クロスモーダル検索などの重要な医療アプリケーションが容易になります。一般的なアプローチの 1 つは、意味的に似ている (正) および異なる (負) のデータ ポイントのペアを対比することです。トレーニング データ セットから一様にネガティブ サンプルを抽出すると、偽ネガティブ、つまり、類似していないが同じクラスに属するサンプルとして扱われるサンプルが導入されます。医療データでは、基礎となるクラスの分布は不均一であり、偽陰性が非常に変動する率で発生することを意味します。学習した表現の品質を向上させるために、偽陰性を修正する新しいアプローチを開発しました。私たちの方法は、推定されたサンプル固有のクラス確率を使用する、偏りのない制約的学習の変形と見なすことができます。目的関数の理論的分析を提供し、画像と画像とテキストのペアのデータセットの両方で提案されたアプローチを示します。私たちの実験は、サンプル固有のバイアス緩和の経験的な利点を示しています。
Self-supervised representation learning on image-text data facilitates crucial medical applications, such as image classification, visual grounding, and cross-modal retrieval. One common approach involves contrasting semantically similar (positive) and dissimilar (negative) pairs of data points. Drawing negative samples uniformly from the training data set introduces false negatives, i.e., samples that are treated as dissimilar but belong to the same class. In healthcare data, the underlying class distribution is nonuniform, implying that false negatives occur at a highly variable rate. To improve the quality of learned representations, we develop a novel approach that corrects for false negatives. Our method can be viewed as a variant of debiased constrastive learning that uses estimated sample-specific class probabilities. We provide theoretical analysis of the objective function and demonstrate the proposed approach on both image and paired image-text data sets. Our experiments demonstrate empirical advantages of sample-specific debiasing.
updated: Tue Apr 25 2023 22:23:41 GMT+0000 (UTC)
published: Tue Apr 25 2023 22:23:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト