セマンティックセグメンテーションのシミュレーションから実ドメインへの適応は、自動運転などのさまざまなアプリケーションで積極的に研究されています。既存の方法は主に単一ソース設定に焦点を当てていますが、これは異なる分布を持つ複数ソースのより実用的なシナリオを簡単に処理することはできません。本論文では、セマンティックセグメンテーションのためのマルチソースドメイン適応を調査することを提案します。具体的には、マルチソースの敵対ドメイン集約ネットワーク(MADAN)と呼ばれる、エンドツーエンドの方法でトレーニングできる新しいフレームワークを設計します。最初に、ピクセルレベルのサイクルで一貫してターゲットに向けて調整しながら、動的なセマンティクスの一貫性を備えた各ソースの適応ドメインを生成します。第二に、サブドメイン集約識別器とクロスドメインサイクル識別器を提案し、異なる適合ドメインをより密接に集約します。最後に、セグメンテーションネットワークのトレーニング中に、集約ドメインとターゲットドメイン間で機能レベルのアライメントが実行されます。合成GTAおよびSYNTHIAから実際のCityscapesおよびBDDSデータセットまでの広範な実験は、提案されたMADANモデルが最先端のアプローチよりも優れていることを示しています。ソースコードはhttps://github.com/Luodian/MADANで公開されています。
Simulation-to-real domain adaptation for semantic segmentation has been actively studied for various applications such as autonomous driving. Existing methods mainly focus on a single-source setting, which cannot easily handle a more practical scenario of multiple sources with different distributions. In this paper, we propose to investigate multi-source domain adaptation for semantic segmentation. Specifically, we design a novel framework, termed Multi-source Adversarial Domain Aggregation Network (MADAN), which can be trained in an end-to-end manner. First, we generate an adapted domain for each source with dynamic semantic consistency while aligning at the pixel-level cycle-consistently towards the target. Second, we propose sub-domain aggregation discriminator and cross-domain cycle discriminator to make different adapted domains more closely aggregated. Finally, feature-level alignment is performed between the aggregated domain and target domain while training the segmentation network. Extensive experiments from synthetic GTA and SYNTHIA to real Cityscapes and BDDS datasets demonstrate that the proposed MADAN model outperforms state-of-the-art approaches. Our source code is released at: https://github.com/Luodian/MADAN.