arXiv reaDer
構造化出力スペースをセマンティックセグメンテーションに適応させる学習
Learning to Adapt Structured Output Space for Semantic Segmentation
セマンティックセグメンテーションのための畳み込みニューラルネットワークベースのアプローチは、ピクセルレベルのグラウンドトゥルースによる監視に依存していますが、目に見えない画像ドメインにうまく一般化できない場合があります。ラベル付けプロセスは面倒で手間がかかるため、ソースグラウンドトゥルースラベルをターゲットドメインに適応できるアルゴリズムの開発は非常に重要です。この論文では、セマンティックセグメンテーションのコンテキストでドメイン適応のための敵対的な学習方法を提案します。セマンティックセグメンテーションを、ソースドメインとターゲットドメイン間の空間的類似性を含む構造化された出力と見なして、出力空間で敵対的学習を採用します。適応モデルをさらに強化するために、マルチレベルの敵対的ネットワークを構築して、さまざまな機能レベルで出力空間ドメインの適応を効果的に実行します。広範囲にわたる実験とアブレーション研究は、合成から現実へのシナリオや都市間のシナリオなど、さまざまなドメイン適応設定の下で行われます。提案された方法は、精度と視覚的品質の点で、最先端の方法に対して有利に機能することを示します。
Convolutional neural network-based approaches for semantic segmentation rely on supervision with pixel-level ground truth, but may not generalize well to unseen image domains. As the labeling process is tedious and labor intensive, developing algorithms that can adapt source ground truth labels to the target domain is of great interest. In this paper, we propose an adversarial learning method for domain adaptation in the context of semantic segmentation. Considering semantic segmentations as structured outputs that contain spatial similarities between the source and target domains, we adopt adversarial learning in the output space. To further enhance the adapted model, we construct a multi-level adversarial network to effectively perform output space domain adaptation at different feature levels. Extensive experiments and ablation study are conducted under various domain adaptation settings, including synthetic-to-real and cross-city scenarios. We show that the proposed method performs favorably against the state-of-the-art methods in terms of accuracy and visual quality.
updated: Mon Jul 06 2020 06:45:05 GMT+0000 (UTC)
published: Wed Feb 28 2018 10:39:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト