arXiv reaDer
データ フィードバック ループ: データセット バイアスのモデル駆動型増幅
Data Feedback Loops: Model-driven Amplification of Dataset Biases
インターネットからスクレイピングされたデータセットは、大規模な機械学習の成功に不可欠です。しかし、この成功は、将来のインターネット由来のデータセットの有用性を潜在的なリスクにさらすものであり、モデルの出力が監督のソースとして人間の注釈に取って代わり始めているためです。この作業では、最初に、1 つのモデルとのやり取りが履歴として記録され、将来のトレーニング データとしてスクレイピングされるシステムを形式化します。次に、テスト時のバイアス統計 (モデル予測の性別バイアスなど) の変化を追跡することにより、長期にわたる安定性を分析します。バイアス増幅の程度は、モデルの出力がトレーニング分布からのサンプルのように動作するかどうかと密接に関連していることがわかりました。これは、一貫したキャリブレーションとして特徴付け、定義する動作です。 3 つの条件付き予測シナリオ (画像分類、視覚的な役割のラベル付け、および言語生成) での実験は、サンプリングのような動作を示すモデルがより調整されているため、より安定していることを示しています。この洞察に基づいて、不安定なフィードバック システムの調整と安定化に役立つ介入を提案します。コードは https://github.com/rtaori/data_feedback で入手できます。
Datasets scraped from the internet have been critical to the successes of large-scale machine learning. Yet, this very success puts the utility of future internet-derived datasets at potential risk, as model outputs begin to replace human annotations as a source of supervision. In this work, we first formalize a system where interactions with one model are recorded as history and scraped as training data in the future. We then analyze its stability over time by tracking changes to a test-time bias statistic (e.g. gender bias of model predictions). We find that the degree of bias amplification is closely linked to whether the model's outputs behave like samples from the training distribution, a behavior which we characterize and define as consistent calibration. Experiments in three conditional prediction scenarios - image classification, visual role-labeling, and language generation - demonstrate that models that exhibit a sampling-like behavior are more calibrated and thus more stable. Based on this insight, we propose an intervention to help calibrate and stabilize unstable feedback systems. Code is available at https://github.com/rtaori/data_feedback.
updated: Thu Sep 08 2022 17:35:51 GMT+0000 (UTC)
published: Thu Sep 08 2022 17:35:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト