最先端のモデルは、多くの場合、ドメイン外または敵対的な設定にうまく一般化されていないデータの表面パターンを利用します。たとえば、テキスト含意モデルは、特定のキーワードが文脈に関係なく含意を暗示していることを学習することが多く、視覚的な質問応答モデルは画像内の証拠を考慮せずにプロトタイプの回答を予測することを学習します。このホワイトペーパーでは、このようなバイアスについての事前知識がある場合、ドメインシフトに対してより堅牢になるようにモデルをトレーニングできることを示します。この方法には2つの段階があります:(1)データセットバイアスのみに基づいて予測を行う単純なモデルを訓練し、(2)単純なモデルとのアンサンブルの一部としてロバストなモデルを訓練して、他のパターンに集中するように促します一般化する可能性が高いデータで。ドメイン外のテストセットを使用した5つのデータセットの実験では、変化する事前ビジュアル質問応答データセットでの12ポイントのゲインと、敵対的な質問応答テストセットでの9ポイントのゲインを含む、すべての設定でロバスト性が大幅に改善されています。
State-of-the-art models often make use of superficial patterns in the data that do not generalize well to out-of-domain or adversarial settings. For example, textual entailment models often learn that particular key words imply entailment, irrespective of context, and visual question answering models learn to predict prototypical answers, without considering evidence in the image. In this paper, we show that if we have prior knowledge of such biases, we can train a model to be more robust to domain shift. Our method has two stages: we (1) train a naive model that makes predictions exclusively based on dataset biases, and (2) train a robust model as part of an ensemble with the naive one in order to encourage it to focus on other patterns in the data that are more likely to generalize. Experiments on five datasets with out-of-domain test sets show significantly improved robustness in all settings, including a 12 point gain on a changing priors visual question answering dataset and a 9 point gain on an adversarial question answering test set.