arXiv reaDer
教師なしノイズ除去によるロバストなクロスドメイン画像理解に向けて
Towards Robust Cross-domain Image Understanding with Unsupervised Noise Removal
深層学習モデルは通常、満足のいくパフォーマンスを達成するために大量のラベル付きデータを必要とします。マルチメディア分析では、ドメイン適応により、ラベルが豊富なソースドメインからラベルが不足しているターゲットドメインへのクロスドメイン知識の転送の問題が調査されるため、深層学習モデルの注釈要件が軽減される可能性があります。ただし、ソースドメインにノイズが多い場合、クロスドメイン画像を理解するための最新のドメイン適応方法はうまく機能しないことがわかります。弱教師ありドメイン適応(WSDA)は、ソースデータにノイズが発生する可能性があるシナリオでのドメイン適応問題を調査します。 WSDAの以前の方法では、ノイズの多いソースデータを削除し、埋め込みスペースのきめ細かいセマンティック構造を考慮せずに、ドメイン間の周辺分布を調整します。これには、クラスの不整合の問題があります。たとえば、ターゲットドメインの猫の機能が機能の近くにマッピングされる場合があります。ソースドメイン内の犬の数。この論文では、WSDAのためのノイズトレラントドメイン適応と呼ばれる新しい方法を提案します。具体的には、クラスターの仮定を採用し、埋め込みスペースのクラスプロトタイプを使用してクラスターを識別的に学習します。埋め込み空間内のデータポイントの位置情報を活用し、ガウス混合モデルを使用して位置情報をモデル化して、ノイズの多いソースデータを特定することを提案します。次に、監視されていないノイズ除去のサブモジュールとしてガウス混合ノイズモデルを組み込んだネットワークを設計し、ドメイン間でセマンティック構造をマッピングするために、ラベルのないターゲットデータをノイズの少ないクラスプロトタイプと整列させる新しいクラスターレベルの敵対的適応方法を提案します。 COVID-19およびeコマースデータセットからの一般画像と医用画像の両方に対する方法の有効性を評価するために、広範な実験を実施しています。結果は、私たちの方法が最先端のWSDA方法を大幅に上回っていることを示しています。
Deep learning models usually require a large amount of labeled data to achieve satisfactory performance. In multimedia analysis, domain adaptation studies the problem of cross-domain knowledge transfer from a label rich source domain to a label scarce target domain, thus potentially alleviates the annotation requirement for deep learning models. However, we find that contemporary domain adaptation methods for cross-domain image understanding perform poorly when source domain is noisy. Weakly Supervised Domain Adaptation (WSDA) studies the domain adaptation problem under the scenario where source data can be noisy. Prior methods on WSDA remove noisy source data and align the marginal distribution across domains without considering the fine-grained semantic structure in the embedding space, which have the problem of class misalignment, e.g., features of cats in the target domain might be mapped near features of dogs in the source domain. In this paper, we propose a novel method, termed Noise Tolerant Domain Adaptation, for WSDA. Specifically, we adopt the cluster assumption and learn cluster discriminatively with class prototypes in the embedding space. We propose to leverage the location information of the data points in the embedding space and model the location information with a Gaussian mixture model to identify noisy source data. We then design a network which incorporates the Gaussian mixture noise model as a sub-module for unsupervised noise removal and propose a novel cluster-level adversarial adaptation method which aligns unlabeled target data with the less noisy class prototypes for mapping the semantic structure across domains. We conduct extensive experiments to evaluate the effectiveness of our method on both general images and medical images from COVID-19 and e-commerce datasets. The results show that our method significantly outperforms state-of-the-art WSDA methods.
updated: Thu Sep 09 2021 14:06:59 GMT+0000 (UTC)
published: Thu Sep 09 2021 14:06:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト