arXiv reaDer
敵対的識別ドメイン適応のための改善されたテクニック
Improved Techniques for Adversarial Discriminative Domain Adaptation
 敵対的識別ドメイン適応(ADDA)は、画像分類における教師なしドメイン適応のための効率的なフレームワークであり、ソースドメインとターゲットドメインは同じクラスを持っていると想定されますが、ターゲットドメインに使用できるラベルはありません。新しいフレームワークと新しい損失定式化によってADDAのパフォーマンスを改善できるかどうかを調査します。半教師付きGANのフレームワークに従って、ドメインとタスクの共同分布をモデル化するために、最初にソースクラスのディスクリミネーター出力を拡張します。したがって、ソースエンコーダの事後分布(敵対トレーニング中に固定)の分布を活用し、ターゲットエンコーダ分布をソースドメインに合わせるための最大平均不一致(MMD)および再構成ベースの損失関数を提案します。フレームワークと損失の定式化がADDAの単純なマルチクラス拡張や半教師付きGANの他の識別型バリアントにどのように拡張されるかについて、包括的な分析を比較して提供します。さらに、トレーニングを安定化するためのさまざまな形式の正則化を導入します。これには、識別器をノイズ除去オートエンコーダーとして扱い、ターゲットエンコーダーをソースの例で正則化して、収縮マッピングの下でのオーバーフィッティングを減らします(つまり、ターゲットごとのクラス分布がアライメント中に縮小する場合)ソースで)。最後に、SVHNやMNISTなどの標準的なドメイン適応データセットのフレームワークを検証します。また、ニューロモルフィックビジョンセンシング(NVS)手話認識データセットを導入および評価することにより、フレームワークがトレーニングデータを欠くモダリティに基づいて認識問題にどのように役立つかを調べます。ソースおよびターゲットドメインはそれぞれエミュレートおよび実際のニューロモルフィックスパイクイベントを構成します。すべてのデータセットに関する結果は、私たちの提案が、教師なしのドメイン適応において最先端の技術と競合するか、それを上回ることを示しています。
Adversarial discriminative domain adaptation (ADDA) is an efficient framework for unsupervised domain adaptation in image classification, where the source and target domains are assumed to have the same classes, but no labels are available for the target domain. We investigate whether we can improve performance of ADDA with a new framework and new loss formulations. Following the framework of semi-supervised GANs, we first extend the discriminator output over the source classes, in order to model the joint distribution over domain and task. We thus leverage on the distribution over the source encoder posteriors (which is fixed during adversarial training) and propose maximum mean discrepancy (MMD) and reconstruction-based loss functions for aligning the target encoder distribution to the source domain. We compare and provide a comprehensive analysis of how our framework and loss formulations extend over simple multi-class extensions of ADDA and other discriminative variants of semi-supervised GANs. In addition, we introduce various forms of regularization for stabilizing training, including treating the discriminator as a denoising autoencoder and regularizing the target encoder with source examples to reduce overfitting under a contraction mapping (i.e., when the target per-class distributions are contracting during alignment with the source). Finally, we validate our framework on standard domain adaptation datasets, such as SVHN and MNIST. We also examine how our framework benefits recognition problems based on modalities that lack training data, by introducing and evaluating on a neuromorphic vision sensing (NVS) sign language recognition dataset, where the source and target domains constitute emulated and real neuromorphic spike events respectively. Our results on all datasets show that our proposal competes or outperforms the state-of-the-art in unsupervised domain adaptation.
updated: Sun Nov 10 2019 21:21:10 GMT+0000 (UTC)
published: Mon Sep 10 2018 22:56:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト