arXiv reaDer
Fishr:分布外の一般化のための不変勾配分散
Fishr: Invariant Gradient Variances for Out-of-distribution Generalization
データ分布の変化の下で十分に一般化する堅牢なモデルを学習することは、実際のアプリケーションにとって重要です。この目的のために、複数のトレーニングドメインから同時に学習することへの関心が高まっていますが、それらのドメイン間でさまざまなタイプの不変性を強制しています。それでも、既存のすべてのアプローチは、公正な評価プロトコルの下で体系的な利益を示すことができません。この論文では、損失関数の勾配の空間でドメイン不変性を強制するための新しい学習スキームを提案します。具体的には、トレーニングドメイン全体の勾配のドメインレベルの分散に一致する正則化項を導入します。重要なことに、Fishrという名前の私たちの戦略は、フィッシャー情報量および損失のヘッセ行列と密接な関係を示しています。学習手順中にドメインレベルの勾配共分散を同様に強制することで、最終的にドメインレベルの損失ランドスケープを最終的な重みの周りに局所的に調整することを示します。広範な実験により、分布外の一般化に対するFishrの有効性が実証されています。特に、Fishrは、DomainBedベンチマークの最新技術を改善し、経験的リスク最小化よりも大幅に優れたパフォーマンスを発揮します。コードはhttps://github.com/alexrame/fishrでリリースされています。
Learning robust models that generalize well under changes in the data distribution is critical for real-world applications. To this end, there has been a growing surge of interest to learn simultaneously from multiple training domains - while enforcing different types of invariance across those domains. Yet, all existing approaches fail to show systematic benefits under fair evaluation protocols. In this paper, we propose a new learning scheme to enforce domain invariance in the space of the gradients of the loss function: specifically, we introduce a regularization term that matches the domain-level variances of gradients across training domains. Critically, our strategy, named Fishr, exhibits close relations with the Fisher Information and the Hessian of the loss. We show that forcing domain-level gradient covariances to be similar during the learning procedure eventually aligns the domain-level loss landscapes locally around the final weights. Extensive experiments demonstrate the effectiveness of Fishr for out-of-distribution generalization. In particular, Fishr improves the state of the art on the DomainBed benchmark and performs significantly better than Empirical Risk Minimization. The code is released at https://github.com/alexrame/fishr.
updated: Tue Sep 07 2021 08:36:09 GMT+0000 (UTC)
published: Tue Sep 07 2021 08:36:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト