arXiv reaDer
ソフト疑似ラベルとカリキュラム学習による教師なしドメイン適応の強化
Boosting Unsupervised Domain Adaptation with Soft Pseudo-label and Curriculum Learning
完全にラベル付けされたソースドメインからのデータを活用することにより、教師なしドメイン適応(UDA)は、データ分散または敵対的学習の明示的な不一致の最小化を通じて、ラベル付けされていないターゲットドメインの分類パフォーマンスを向上させます。拡張機能として、モデル予測を利用してターゲットの特徴の識別を強化するために、適応中にカテゴリの配置が含まれます。ただし、ターゲットドメインでの誤ったカテゴリ予測によって発生する疑似ラベルの不正確さ、およびソースドメインでの過剰適合によって引き起こされる分布の偏差については、未踏の問題が残っています。この論文では、モデルにとらわれない2段階の学習フレームワークを提案します。これは、ソフト疑似ラベル戦略を使用して欠陥のあるモデル予測を大幅に削減し、カリキュラム学習戦略でソースドメインに過剰適合することを回避します。理論的には、ターゲットドメインで予想されるエラーの上限にある複合リスクを正常に減らすことができます。最初の段階では、分布アライメントベースのUDAメソッドを使用してモデルをトレーニングし、ターゲットドメインでかなり高い信頼性でソフトセマンティックラベルを取得します。ソースドメインへの過剰適合を回避するために、第2段階では、トレーニング段階の焦点がソース分布からターゲット分布に徐々にシフトし、予測の信頼性が向上するように、2つのドメインからの損失間の重み付けを適応的に制御するカリキュラム学習戦略を提案します。ターゲットドメイン上。 2つのよく知られたベンチマークデータセットでの広範な実験により、トップランクのUDAアルゴリズムのパフォーマンスを促進する上で、提案されたフレームワークの普遍的な有効性が検証され、その一貫した優れたパフォーマンスが実証されます。
By leveraging data from a fully labeled source domain, unsupervised domain adaptation (UDA) improves classification performance on an unlabeled target domain through explicit discrepancy minimization of data distribution or adversarial learning. As an enhancement, category alignment is involved during adaptation to reinforce target feature discrimination by utilizing model prediction. However, there remain unexplored problems about pseudo-label inaccuracy incurred by wrong category predictions on target domain, and distribution deviation caused by overfitting on source domain. In this paper, we propose a model-agnostic two-stage learning framework, which greatly reduces flawed model predictions using soft pseudo-label strategy and avoids overfitting on source domain with a curriculum learning strategy. Theoretically, it successfully decreases the combined risk in the upper bound of expected error on the target domain. At the first stage, we train a model with distribution alignment-based UDA method to obtain soft semantic label on target domain with rather high confidence. To avoid overfitting on source domain, at the second stage, we propose a curriculum learning strategy to adaptively control the weighting between losses from the two domains so that the focus of the training stage is gradually shifted from source distribution to target distribution with prediction confidence boosted on the target domain. Extensive experiments on two well-known benchmark datasets validate the universal effectiveness of our proposed framework on promoting the performance of the top-ranked UDA algorithms and demonstrate its consistent superior performance.
updated: Fri Dec 03 2021 14:47:32 GMT+0000 (UTC)
published: Fri Dec 03 2021 14:47:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト