arXiv reaDer
FSDR:ドメイン一般化のための周波数空間ドメインランダム化
FSDR: Frequency Space Domain Randomization for Domain Generalization
ドメインの一般化は、さまざまな未知のターゲットドメインの既知のソースドメインから一般化可能なモデルを学習することを目的としています。ドメインにとらわれない特徴を学習するために、ソース画像を空間空間のさまざまなスタイルに転送するドメインランダム化によって広く研究されてきました。ただし、ほとんどの既存のランダム化では、制御が不足していることが多く、画像のセマンティック構造を望ましくない形で変更するGANを使用しています。空間画像を複数の周波数成分(FC)に変換するJPEGのアイデアに着想を得て、ドメイン不変FC(DIF)を維持し、ドメインバリアントFC(DVF)をランダム化することにより、周波数空間で画像をランダム化する周波数空間ドメインランダム化(FSDR)を提案します。 )のみ。 FSDRには2つの独自の機能があります。1)画像をDIFとDVFに分解し、それらの明示的なアクセスと操作、およびより制御可能なランダム化を可能にします。 2)画像のセマンティック構造とドメイン不変の特徴への影響は最小限です。 FCのドメイン分散と不変性の特性を統計的に調べ、反復学習を通じてDIFとDVFを動的に識別して融合できるネットワークを設計しました。複数のドメインの一般化可能なセグメンテーションタスクに関する広範な実験により、FSDRは優れたセグメンテーションを実現し、そのパフォーマンスはトレーニングでターゲットデータにアクセスするドメイン適応方法と同等であることが示されています。
Domain generalization aims to learn a generalizable model from a known source domain for various unknown target domains. It has been studied widely by domain randomization that transfers source images to different styles in spatial space for learning domain-agnostic features. However, most existing randomization uses GANs that often lack of controls and even alter semantic structures of images undesirably. Inspired by the idea of JPEG that converts spatial images into multiple frequency components (FCs), we propose Frequency Space Domain Randomization (FSDR) that randomizes images in frequency space by keeping domain-invariant FCs (DIFs) and randomizing domain-variant FCs (DVFs) only. FSDR has two unique features: 1) it decomposes images into DIFs and DVFs which allows explicit access and manipulation of them and more controllable randomization; 2) it has minimal effects on semantic structures of images and domain-invariant features. We examined domain variance and invariance property of FCs statistically and designed a network that can identify and fuse DIFs and DVFs dynamically through iterative learning. Extensive experiments over multiple domain generalizable segmentation tasks show that FSDR achieves superior segmentation and its performance is even on par with domain adaptation methods that access target data in training.
updated: Wed Mar 03 2021 12:42:28 GMT+0000 (UTC)
published: Wed Mar 03 2021 12:42:28 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト