arXiv reaDer
DAIR:データ拡張不変正則化
DAIR: Data Augmented Invariant Regularization
経験的リスク最小化(ERM)による深層学習は、さまざまな複雑なタスクで人間レベルのパフォーマンスを達成することに成功しましたが、ERMは分布シフトに一般化されていません。これは、画像の背景や自然言語の名前付きエンティティなどの偽の機能に過剰適合することで部分的に説明されます。合成データ拡張とそれに続く経験的リスク最小化(DA-ERM)は、この問題を解決するためのシンプルでありながら強力なソリューションです。この論文では、データ拡張不変正則化(DAIR)を提案します。 DAIRの考え方は、モデルのパフォーマンス(損失)が拡張されたサンプルと元のサンプルで一貫していることが望まれるという観察に基づいています。 DAIRは、DA-ERMに正則化を導入して、このような損失の不整合にペナルティを課します。理論的にも経験的な実験を通じても、特定の形式のDAIR正則化がさまざまな設定で一貫して良好に機能することを示しています。これを、ドメインシフトを含む複数の実世界の学習問題、つまりロバスト回帰、視覚的な質問応答、ロバストなディープニューラルネットワークトレーニング、およびタスク指向のダイアログモデリングに適用します。私たちの実験は、DAIRがERMおよびDA-ERMを一貫して上回っており、限界費用がほとんどなく、いくつかのベンチマークで新しい最先端の結果を設定していることを示しています。
While deep learning through empirical risk minimization (ERM) has succeeded at achieving human-level performance at a variety of complex tasks, ERM generalizes poorly to distribution shift. This is partly explained by overfitting to spurious features such as background in images or named entities in natural language. Synthetic data augmentation followed by empirical risk minimization (DA-ERM) is a simple yet powerful solution to remedy this problem. In this paper, we propose data augmented invariant regularization (DAIR). The idea of DAIR is based on the observation that the model performance (loss) is desired to be consistent on the augmented sample and the original one. DAIR introduces a regularizer on DA-ERM to penalize such loss inconsistency. Both theoretically and through empirical experiments, we show that a particular form of the DAIR regularizer consistently performs well in a variety of settings. We apply it to multiple real-world learning problems involving domain shift, namely robust regression, visual question answering, robust deep neural network training, and task-oriented dialog modeling. Our experiments show that DAIR consistently outperforms ERM and DA-ERM with little marginal cost and setting new state-of-the-art results in several benchmarks.
updated: Thu Oct 21 2021 15:30:40 GMT+0000 (UTC)
published: Thu Oct 21 2021 15:30:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト