arXiv reaDer
条件不変のセマンティック セグメンテーション
Condition-Invariant Semantic Segmentation
トレーニング時にグラウンドトゥルースのアノテーションが利用可能な視覚条件とは異なる視覚条件にセマンティック セグメンテーション ネットワークを適応させることは、自動運転車やロボットの堅牢な認識にとって不可欠です。しかし、以前の研究では、敵対的トレーニングを採用し、合成から現実への適応で検証されているほとんどの特徴レベルの適応方法は、通常から逆境への条件レベルの適応においてわずかな利益を提供し、単純なピクセルレベルの適応よりも優れていることが示されています。様式化による適応。これらの発見に動機付けられて、ネットワークのエンコーダーによってオリジナルから抽出された深い特徴と、新しい特徴の不変性損失を備えた各入力画像の様式化されたビューを調整することにより、特徴レベルの適応を実行する際に様式化を活用することを提案します。このようにして、エンコーダーが入力のスタイルに対して不変の特徴を抽出することを奨励し、デコーダーが入力の特定のスタイルからのさらなる抽象化ではなく、これらの特徴の解析に集中できるようにします。私たちは、Condition-Invariant Semantic Segmentation (CISS) と呼ばれる私たちの手法を、最高のパフォーマンスを誇るドメイン適応アーキテクチャに実装し、Cityscapes\toACDC と Cityscapes\toDark Zurich の両方の適応において、以前の最先端の手法と比べて大幅な改善を実証しました。特に、CISS は、公開 ACDC リーダーボードで公開されているすべての教師なしドメイン適応手法の中で 1 位にランクされています。また、私たちの方法は、トレーニング中に見えないドメインによく一般化でき、BDD100K 夜間および夜間運転において競合するドメイン適応アプローチよりも優れていることが示されています。コードは https://github.com/SysCV/CISS で公開されています。
Adaptation of semantic segmentation networks to different visual conditions from those for which ground-truth annotations are available at training is vital for robust perception in autonomous cars and robots. However, previous work has shown that most feature-level adaptation methods, which employ adversarial training and are validated on synthetic-to-real adaptation, provide marginal gains in normal-to-adverse condition-level adaptation, being outperformed by simple pixel-level adaptation via stylization. Motivated by these findings, we propose to leverage stylization in performing feature-level adaptation by aligning the deep features extracted by the encoder of the network from the original and the stylized view of each input image with a novel feature invariance loss. In this way, we encourage the encoder to extract features that are invariant to the style of the input, allowing the decoder to focus on parsing these features and not on further abstracting from the specific style of the input. We implement our method, named Condition-Invariant Semantic Segmentation (CISS), on the top-performing domain adaptation architecture and demonstrate a significant improvement over previous state-of-the-art methods both on Cityscapes\toACDC and Cityscapes\toDark Zurich adaptation. In particular, CISS is ranked first among all published unsupervised domain adaptation methods on the public ACDC leaderboard. Our method is also shown to generalize well to domains unseen during training, outperforming competing domain adaptation approaches on BDD100K-night and Nighttime Driving. Code is publicly available at https://github.com/SysCV/CISS .
updated: Sat May 27 2023 03:05:07 GMT+0000 (UTC)
published: Sat May 27 2023 03:05:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト