この作業では、教師なしドメイン適応(UDA)でソースドメインとターゲットドメインの間で1対1のマッピング(「変換」)を使用する一般的なアプローチに挑戦します。代わりに、固有の翻訳のあいまいさをキャプチャするために確率的翻訳に依存しています。これにより、(i)同じソース画像を条件とする複数の出力を生成することでより正確なターゲットネットワークをトレーニングし、外観の変動性のために正確な変換とデータ拡張の両方を活用し、(ii)予測を平均化することでターゲットデータに堅牢な疑似ラベルを付けることができます単一のターゲット画像の複数の翻訳バージョンでのソースネットワークの評価、および(iii)翻訳の確率の程度を調整することにより、ターゲットドメインで多様なネットワークをトレーニングおよびアンサンブルします。強力な最近のベースラインに対する改善を報告し、2つの挑戦的なセマンティックセグメンテーションベンチマークで最先端のUDA結果をもたらします。
In this work we challenge the common approach of using a one-to-one mapping ('translation') between the source and target domains in unsupervised domain adaptation (UDA). Instead, we rely on stochastic translation to capture inherent translation ambiguities. This allows us to (i) train more accurate target networks by generating multiple outputs conditioned on the same source image, leveraging both accurate translation and data augmentation for appearance variability, (ii) impute robust pseudo-labels for the target data by averaging the predictions of a source network on multiple translated versions of a single target image and (iii) train and ensemble diverse networks in the target domain by modulating the degree of stochasticity in the translations. We report improvements over strong recent baselines, leading to state-of-the-art UDA results on two challenging semantic segmentation benchmarks.