このペーパーでは、ドメインの一般化(DG)に焦点を当てます。複数のソースドメインから、見えないドメインにうまく一般化するモデルを学習するタスクです。 DGの主な課題は、利用可能なソースドメインの多様性が限られていることが多く、モデルの一般化を学習する能力が妨げられていることです。したがって、データジェネレーターを使用して、疑似小説ドメインからのデータを合成し、ソースドメインを拡張します。これにより、利用可能なトレーニングドメインの多様性が明確に増加し、より一般化可能なモデルが作成されます。ジェネレーターをトレーニングするために、最適なトランスポートを使用して、ソースと合成された疑似小説ドメインとの間の分布の発散をモデル化し、発散を最大化します。合成データでセマンティクスが確実に保持されるように、ジェネレーターにサイクルの一貫性と分類の損失をさらに課します。私たちの手法であるL2A-OT(Optimal Transportによる拡張学習)は、4つのベンチマークデータセットで現在の最先端のDG手法よりも優れています。
This paper focuses on domain generalization (DG), the task of learning from multiple source domains a model that generalizes well to unseen domains. A main challenge for DG is that the available source domains often exhibit limited diversity, hampering the model's ability to learn to generalize. We therefore employ a data generator to synthesize data from pseudo-novel domains to augment the source domains. This explicitly increases the diversity of available training domains and leads to a more generalizable model. To train the generator, we model the distribution divergence between source and synthesized pseudo-novel domains using optimal transport, and maximize the divergence. To ensure that semantics are preserved in the synthesized data, we further impose cycle-consistency and classification losses on the generator. Our method, L2A-OT (Learning to Augment by Optimal Transport) outperforms current state-of-the-art DG methods on four benchmark datasets.