Selective Transfer with Reinforced Transfer Network for Partial Domain Adaptation
 部分ドメイン適応(PDA)の重要な側面の1つは、共有クラスで関連するソースサンプルを知識伝達用に選択する方法です。以前のPDAメソッドは、高レベルの情報(深い機能)に基づいてソースサンプルを再重み付けすることにより、この問題に対処します。ただし、ソースドメインとターゲットドメインの間でドメインがシフトするため、サンプル選択に深い機能のみを使用すると欠陥があります。外れ値のソースクラスとターゲットクラスの外観の違いが非常に大きいため、PDA問題のピクセルレベルの情報をさらに活用する方が合理的であると主張します。この論文では、PDA問題のために高レベルとピクセルレベルの両方の情報を利用する強化転送ネットワーク(RTNet)を提案します。 RTNetは、強化学習(RL)に基づく強化データセレクター(RDS)で構成されています。これは、外れ値のソースサンプルをフィルターで除外し、共有ラベルスペースのドメインの不一致を最小限に抑えるドメイン適応モデルです。具体的には、RDSでは、ターゲットジェネレーターで選択されたソースサンプルの再構築エラーに基づいて、ピクセルレベルの情報を導入してRDSの学習をガイドする新しい報酬を設計します。さらに、RDSがサンプル選択に使用する高レベルの情報を含む状態を開発します。提案されているRDSは汎用モジュールであり、既存のDAモデルに簡単に統合して、PDAの状況に適合させることができます。広範な実験により、RTNetはいくつかのベンチマークデータセットでPDAタスクの最先端のパフォーマンスを達成できることが示されています。
One crucial aspect of partial domain adaptation (PDA) is how to select the relevant source samples in the shared classes for knowledge transfer. Previous PDA methods tackle this problem by re-weighting the source samples based on their high-level information (deep features). However, since the domain shift between source and target domains, only using the deep features for sample selection is defective. We argue that it is more reasonable to additionally exploit the pixel-level information for PDA problem, as the appearance difference between outlier source classes and target classes is significantly large. In this paper, we propose a reinforced transfer network (RTNet), which utilizes both high-level and pixel-level information for PDA problem. Our RTNet is composed of a reinforced data selector (RDS) based on reinforcement learning (RL), which filters out the outlier source samples, and a domain adaptation model which minimizes the domain discrepancy in the shared label space. Specifically, in the RDS, we design a novel reward based on the reconstruct errors of selected source samples on the target generator, which introduces the pixel-level information to guide the learning of RDS. Besides, we develope a state containing high-level information, which used by the RDS for sample selection. The proposed RDS is a general module, which can be easily integrated into existing DA models to make them fit the PDA situation. Extensive experiments indicate that RTNet can achieve state-of-the-art performance for PDA tasks on several benchmark datasets.
updated: Fri Feb 28 2020 01:59:52 GMT+0000 (UTC)
published: Sun May 26 2019 07:59:36 GMT+0000 (UTC)
