arXiv reaDer
教師なしドメイン適応のための深さと意味論を関連付けることを学ぶ
Learning to Relate Depth and Semantics for Unsupervised Domain Adaptation
教師なしドメイン適応(UDA)設定でモデルのパフォーマンスを向上させるために、視覚的なタスクの関係をエンコードするためのアプローチを紹介します。セマンティックセグメンテーションと単眼深度推定は、補完的なタスクであることが示されています。マルチタスク学習設定では、それらの関係を適切にエンコードすることで、両方のタスクのパフォーマンスをさらに向上させることができます。この観察に動機付けられて、セマンティック予測と深度予測の間のタスク依存関係をエンコードする、新しいクロスタスク関係レイヤー(CTRL)を提案します。クロスタスクの関係をキャプチャするために、タスク固有のクロスタスクリファインメントヘッドを含むニューラルネットワークアーキテクチャを提案します。さらに、セマンティック疑似ラベルを活用してターゲットドメインをさらに監視する、反復自己学習(ISL)トレーニングスキームを提案します。これらのタスクに存在する補足情報がより適切にキャプチャされるため、両方のタスクのパフォーマンスの向上を実験的に観察します。具体的には、次のことを示します。(1)私たちのアプローチは、すべてのタスクが補完的で相互に依存している場合に、すべてのタスクのパフォーマンスを向上させます。 (2)CTRLは、困難なUDA設定でセマンティックセグメンテーションと深度推定タスクの両方のパフォーマンスを向上させるのに役立ちます。 (3)提案されたISLトレーニングスキームは、セマンティックセグメンテーションのパフォーマンスをさらに向上させます。実装はhttps://github.com/susaha/ctrl-udaで入手できます。
We present an approach for encoding visual task relationships to improve model performance in an Unsupervised Domain Adaptation (UDA) setting. Semantic segmentation and monocular depth estimation are shown to be complementary tasks; in a multi-task learning setting, a proper encoding of their relationships can further improve performance on both tasks. Motivated by this observation, we propose a novel Cross-Task Relation Layer (CTRL), which encodes task dependencies between the semantic and depth predictions. To capture the cross-task relationships, we propose a neural network architecture that contains task-specific and cross-task refinement heads. Furthermore, we propose an Iterative Self-Learning (ISL) training scheme, which exploits semantic pseudo-labels to provide extra supervision on the target domain. We experimentally observe improvements in both tasks' performance because the complementary information present in these tasks is better captured. Specifically, we show that: (1) our approach improves performance on all tasks when they are complementary and mutually dependent; (2) the CTRL helps to improve both semantic segmentation and depth estimation tasks performance in the challenging UDA setting; (3) the proposed ISL training scheme further improves the semantic segmentation performance. The implementation is available at https://github.com/susaha/ctrl-uda.
updated: Mon May 17 2021 13:42:09 GMT+0000 (UTC)
published: Mon May 17 2021 13:42:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト