A Fourier-based Framework for Domain Generalization
最新のディープニューラルネットワークは、トレーニングデータとは異なる分布でテストデータを評価すると、パフォーマンスが低下します。ドメインの一般化は、目に見えないターゲットドメインに一般化するために、複数のソースドメインから移転可能な知識を学習することによってこの問題に取り組むことを目的としています。この論文では、ドメイン一般化のための新しいフーリエベースの視点を紹介します。主な仮定は、フーリエ位相情報には高レベルのセマンティクスが含まれており、ドメインシフトの影響を受けにくいということです。モデルに位相情報をキャプチャさせるために、2つの画像の振幅スペクトル間を線形補間する振幅ミックスと呼ばれる新しいフーリエベースのデータ拡張戦略を開発します。副担任の正則化と呼ばれる二重形式の一貫性の喪失が、元の画像と拡張された画像から誘導された予測の間にさらに導入されます。 3つのベンチマークでの広範な実験により、提案された方法がドメインの一般化のための最先端のパフォーマンスを達成できることが実証されました。
Modern deep neural networks suffer from performance degradation when evaluated on testing data under different distributions from training data. Domain generalization aims at tackling this problem by learning transferable knowledge from multiple source domains in order to generalize to unseen target domains. This paper introduces a novel Fourier-based perspective for domain generalization. The main assumption is that the Fourier phase information contains high-level semantics and is not easily affected by domain shifts. To force the model to capture phase information, we develop a novel Fourier-based data augmentation strategy called amplitude mix which linearly interpolates between the amplitude spectrums of two images. A dual-formed consistency loss called co-teacher regularization is further introduced between the predictions induced from original and augmented images. Extensive experiments on three benchmarks have demonstrated that the proposed method is able to achieve state-of-the-arts performance for domain generalization.
updated: Mon May 24 2021 06:50:30 GMT+0000 (UTC)
published: Mon May 24 2021 06:50:30 GMT+0000 (UTC)
