arXiv reaDer
ADeLA:セマンティックセグメンテーションにおける視点適応に注意を払った自動高密度ラベリング
ADeLA: Automatic Dense Labeling with Attention for Viewpoint Adaptation in Semantic Segmentation
セマンティックセグメンテーションタスクの視点の変更によって引き起こされる画像コンテンツシフトの教師なしドメイン適応方法について説明します。ほとんどの既存の方法は、共有スペースでドメインアライメントを実行し、アライメントされたスペースから出力へのマッピングが転送可能であることを前提としています。しかし、視点の変更によって誘発された新しいコンテンツは、効果的な配置のためのそのようなスペースを無効にする可能性があり、その結果、否定的な適応をもたらします。私たちの方法は、2つのドメイン間で画像の統計を調整しなくても機能します。代わりに、カラー画像のみでトレーニングされたビュー変換ネットワークを利用して、ターゲットのセマンティック画像を幻覚化します。監督の欠如にもかかわらず、注意メカニズムによって導入された誘導バイアスのおかげで、ビュー変換ネットワークは依然としてセマンティック画像に一般化することができます。さらに、セマンティック画像をセマンティックラベルに変換する際のあいまいさを解決するために、ビュー変換ネットワークをカラー画像によって暗示される未知のマッピングの機能表現として扱い、ターゲットドメインで疑似ラベルを生成する機能ラベル幻覚を提案します。私たちの方法は、最先端の対応推定とビュー合成方法に基づいて構築されたベースラインを上回っています。さらに、自己トレーニングと敵対的なドメインアラインメントを利用する最先端の教師なしドメイン適応方法よりも優れています。私たちのコードとデータセットは一般に公開されます。
We describe an unsupervised domain adaptation method for image content shift caused by viewpoint changes for a semantic segmentation task. Most existing methods perform domain alignment in a shared space and assume that the mapping from the aligned space to the output is transferable. However, the novel content induced by viewpoint changes may nullify such a space for effective alignments, thus resulting in negative adaptation. Our method works without aligning any statistics of the images between the two domains. Instead, it utilizes a view transformation network trained only on color images to hallucinate the semantic images for the target. Despite the lack of supervision, the view transformation network can still generalize to semantic images thanks to the inductive bias introduced by the attention mechanism. Furthermore, to resolve ambiguities in converting the semantic images to semantic labels, we treat the view transformation network as a functional representation of an unknown mapping implied by the color images and propose functional label hallucination to generate pseudo-labels in the target domain. Our method surpasses baselines built on state-of-the-art correspondence estimation and view synthesis methods. Moreover, it outperforms the state-of-the-art unsupervised domain adaptation methods that utilize self-training and adversarial domain alignment. Our code and dataset will be made publicly available.
updated: Thu Jul 29 2021 19:10:18 GMT+0000 (UTC)
published: Thu Jul 29 2021 19:10:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト