arXiv reaDer
一般化を改善するためのデータのシャッフル解除
Unshuffling Data for Improved Generalization
トレーニングの分布を超えた一般化は、機械学習の中心的な課題です。ニューラルネットワークをトレーニングするときに例を混合してシャッフルする一般的な方法は、この点で最適ではない可能性があります。複数のトレーニング環境として扱われる、適切に選択された非iidサブセットにデータを分割することで、より優れた分布外一般化を使用してモデルの学習をガイドできることを示します。偽のパターンを破棄しながら、環境全体で安定しているパターンをキャプチャするためのトレーニング手順について説明します。この方法は、相関ベースの学習を超えた一歩を踏み出します。パーティション化を選択することで、トレーニングデータの同時分布からは回復できないタスクに関する情報を注入できます。データセットの偏りで悪名高い視覚的な質問応答のタスクを使用して、複数のユースケースを示します。事前の知識、既存のメタデータ、または教師なしクラスタリングから構築された環境を使用して、VQA-CPを大幅に改善します。また、「同等の質問」の注釈を使用したGQAと、それらを別個の環境として扱うことによるマルチデータセットトレーニング(VQA v2 / Visual Genome)の改善も得られます。
Generalization beyond the training distribution is a core challenge in machine learning. The common practice of mixing and shuffling examples when training neural networks may not be optimal in this regard. We show that partitioning the data into well-chosen, non-i.i.d. subsets treated as multiple training environments can guide the learning of models with better out-of-distribution generalization. We describe a training procedure to capture the patterns that are stable across environments while discarding spurious ones. The method makes a step beyond correlation-based learning: the choice of the partitioning allows injecting information about the task that cannot be otherwise recovered from the joint distribution of the training data. We demonstrate multiple use cases with the task of visual question answering, which is notorious for dataset biases. We obtain significant improvements on VQA-CP, using environments built from prior knowledge, existing meta data, or unsupervised clustering. We also get improvements on GQA using annotations of "equivalent questions", and on multi-dataset training (VQA v2 / Visual Genome) by treating them as distinct environments.
updated: Fri Nov 20 2020 23:14:33 GMT+0000 (UTC)
published: Thu Feb 27 2020 03:07:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト