arXiv reaDer
BiMaL: Bijective Maximum Likelihood Approach to Domain Adaptation in Semantic Scene Segmentation
セマンティックセグメンテーションは、ピクセルレベルのラベルを予測することを目的としています。これは、さまざまなコンピュータビジョンアプリケーションで人気のあるタスクになっています。完全に監視されたセグメンテーション方法は、大規模なビジョンデータセットで高精度を達成しましたが、新しいテスト環境や新しいドメインで一般化することはできません。この作業では、最初に新しい非整列ドメインスコアを導入して、監視されていない方法で新しいターゲットドメインで学習したモデルの効率を測定します。次に、ピクセルの独立性についての仮定なしに、敵対的エントロピー最小化の一般化された形式である新しい全単射最尤(BiMaL)損失を提示します。提案されたBiMaLを2つのドメインで評価しました。提案されたBiMaLアプローチは、「SYNTHIA to Cityscapes」、「GTA5 to Cityscapes」、および「SYNTHIAtoVistas」の実証実験でSOTAメソッドを一貫して上回っています。
Semantic segmentation aims to predict pixel-level labels. It has become a popular task in various computer vision applications. While fully supervised segmentation methods have achieved high accuracy on large-scale vision datasets, they are unable to generalize on a new test environment or a new domain well. In this work, we first introduce a new Un-aligned Domain Score to measure the efficiency of a learned model on a new target domain in unsupervised manner. Then, we present the new Bijective Maximum Likelihood(BiMaL) loss that is a generalized form of the Adversarial Entropy Minimization without any assumption about pixel independence. We have evaluated the proposed BiMaL on two domains. The proposed BiMaL approach consistently outperforms the SOTA methods on empirical experiments on "SYNTHIA to Cityscapes", "GTA5 to Cityscapes", and "SYNTHIA to Vistas".
updated: Fri Aug 06 2021 18:29:43 GMT+0000 (UTC)
published: Fri Aug 06 2021 18:29:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト