arXiv reaDer
ドメインの一般化を改善するためのソース内スタイルの拡張
Intra-Source Style Augmentation for Improved Domain Generalization
自動運転などのアプリケーションで頻繁に現れるドメイン シフトに関する一般化は、ディープ ラーニング モデルに残された大きな課題の 1 つです。したがって、セマンティック セグメンテーションにおけるドメインの一般化を改善するために、イントラソース スタイル拡張 (ISSA) メソッドを提案します。私たちの方法は、StyleGAN2 インバージョン用の新しいマスク ノイズ エンコーダーに基づいています。このモデルは、ノイズ予測によってセマンティック レイアウトを維持しながら画像を忠実に再構築することを学習します。推定されたノイズのランダム マスキングにより、モデルのスタイル ミキシング機能が有効になります。つまり、画像のセマンティック レイアウトに影響を与えることなく全体的な外観を変更できます。提案されたマスクされたノイズ エンコーダーを使用して、トレーニング セット内のスタイルとコンテンツの組み合わせをランダム化することで、ISSA はトレーニング データの多様性を効果的に高め、偽の相関を減らします。その結果、地理的位置の変化、悪天候、昼夜など、さまざまなタイプのデータ シフトの下で、運転シーンのセマンティック セグメンテーションで最大 12.4% の mIoU の改善を達成しました。 ISSA はモデルにとらわれず、CNN とトランスフォーマーに直接適用できます。また、他のドメイン一般化手法を補完するものでもあります。たとえば、最近の最先端ソリューションである RobustNet を、Cityscapes to Dark Zürich で 3% mIoU 改善します。
The generalization with respect to domain shifts, as they frequently appear in applications such as autonomous driving, is one of the remaining big challenges for deep learning models. Therefore, we propose an intra-source style augmentation (ISSA) method to improve domain generalization in semantic segmentation. Our method is based on a novel masked noise encoder for StyleGAN2 inversion. The model learns to faithfully reconstruct the image preserving its semantic layout through noise prediction. Random masking of the estimated noise enables the style mixing capability of our model, i.e. it allows to alter the global appearance without affecting the semantic layout of an image. Using the proposed masked noise encoder to randomize style and content combinations in the training set, ISSA effectively increases the diversity of training data and reduces spurious correlation. As a result, we achieve up to 12.4% mIoU improvements on driving-scene semantic segmentation under different types of data shifts, i.e., changing geographic locations, adverse weather conditions, and day to night. ISSA is model-agnostic and straightforwardly applicable with CNNs and Transformers. It is also complementary to other domain generalization techniques, e.g., it improves the recent state-of-the-art solution RobustNet by 3% mIoU in Cityscapes to Dark Zürich.
updated: Tue Oct 18 2022 21:33:25 GMT+0000 (UTC)
published: Tue Oct 18 2022 21:33:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト