arXiv reaDer
プロンプトアレイがバイアスを回避:敵対的学習による視覚言語モデルのバイアス除去
A Prompt Array Keeps the Bias Away: Debiasing Vision-Language Models with Adversarial Learning
視覚言語モデルは、社会的偏見やステレオタイプをエンコードできますが、これらの害を測定して軽減することには課題があります。以前に提案されたバイアス測定は堅牢性に欠けており、事前トレーニングデータにアクセスせずにバイアスを軽減すると機能の低下が発生します。このホワイトペーパーでは、これらの課題の両方に対処します。まず、さまざまなバイアス測定値を評価し、バイアス測定フレームワークを介して画像テキスト表現に検索メトリックを使用することを提案します。次に、バイアス除去方法を調査し、学習可能なトークンの埋め込みを介して敵対的損失を最適化することで、機能表現を大幅に低下させることなく、さまざまなバイアス測定値を最小限に抑えることを示します。
Vision-language models can encode societal biases and stereotypes, but there are challenges to measuring and mitigating these harms. Prior proposed bias measurements lack robustness and feature degradation occurs when mitigating bias without access to pretraining data. We address both of these challenges in this paper: First, we evaluate different bias measures and propose the use of retrieval metrics to image-text representations via a bias measuring framework. Second, we investigate debiasing methods and show that optimizing for adversarial loss via learnable token embeddings minimizes various bias measures without substantially degrading feature representations.
updated: Tue Mar 22 2022 17:59:04 GMT+0000 (UTC)
published: Tue Mar 22 2022 17:59:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト