arXiv reaDer
異種ドメイン適応のためのクロスドメイン構造保存投影
Cross-Domain Structure Preserving Projection for Heterogeneous Domain Adaptation
ヘテロジニアスドメインアダプテーション(HDA)は、ソースドメインとターゲットドメインからのデータが異なるモダリティ(テキストや画像など)または特徴の次元(異なる方法で抽出された特徴など)である場合の転移学習の問題に対処します。マルチモーダルデータ分析に役立ちます。従来のドメイン適応アルゴリズムは、ソースサンプルとターゲットサンプルの表現が同じ特徴空間に存在することを前提としているため、異種ドメイン適応問題の解決に失敗する可能性があります。現代の最先端のHDAアプローチは、通常、良好なパフォーマンスを得るための複雑な最適化目標で構成されているため、計算コストが高く、一般化が困難です。これらの問題に対処するために、HDA用の新しいクロスドメイン構造保存投影(CDSPP)アルゴリズムを提案します。従来のLPPの異種ドメインへの拡張として、CDSPPは、クラスの一貫性が維持され、データ分布が十分に調整されるように、ソースドメインとターゲットドメインからのサンプル機能を共通の部分空間にマッピングするドメイン固有の予測を学習することを目的としています。 CDSPPは単純で、一般化された固有値問題を解くことにより決定論的なソリューションを提供します。当然、教師ありHDAに適していますが、ラベルのないターゲットドメインサンプルが利用できる半教師ありHDAにも拡張されています。 HDAで一般的に使用されているベンチマークデータセット(Office-Caltech、Multilingual Reuters Collection、NUS-WIDE-ImageNetなど)と、クラス数が非常に多いためにHDA用に最初に導入されたOffice-Homeデータセットについて、広範な実験が行われました。既存のものより(65対10、6および8)。教師ありHDAと半教師ありHDAの両方の実験結果は、現代の最先端の方法に対して、提案された方法の優れたパフォーマンスを示しています。
Heterogeneous Domain Adaptation (HDA) addresses the transfer learning problems where data from the source and target domains are of different modalities (e.g., texts and images) or feature dimensions (e.g., features extracted with different methods). It is useful for multi-modal data analysis. Traditional domain adaptation algorithms assume that the representations of source and target samples reside in the same feature space, hence are likely to fail in solving the heterogeneous domain adaptation problem. Contemporary state-of-the-art HDA approaches are usually composed of complex optimization objectives for favourable performance and are therefore computationally expensive and less generalizable. To address these issues, we propose a novel Cross-Domain Structure Preserving Projection (CDSPP) algorithm for HDA. As an extension of the classic LPP to heterogeneous domains, CDSPP aims to learn domain-specific projections to map sample features from source and target domains into a common subspace such that the class consistency is preserved and data distributions are sufficiently aligned. CDSPP is simple and has deterministic solutions by solving a generalized eigenvalue problem. It is naturally suitable for supervised HDA but has also been extended for semi-supervised HDA where the unlabelled target domain samples are available. Extensive experiments have been conducted on commonly used benchmark datasets (i.e. Office-Caltech, Multilingual Reuters Collection, NUS-WIDE-ImageNet) for HDA as well as the Office-Home dataset firstly introduced for HDA by ourselves due to its significantly larger number of classes than the existing ones (65 vs 10, 6 and 8). The experimental results of both supervised and semi-supervised HDA demonstrate the superior performance of our proposed method against contemporary state-of-the-art methods.
updated: Sat Oct 09 2021 03:27:41 GMT+0000 (UTC)
published: Sun Apr 26 2020 16:22:28 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト