arXiv reaDer
視覚的感情適応のための感情的意味論-保存され機能調整されたCycleGAN
Emotional Semantics-Preserved and Feature-Aligned CycleGAN for Visual Emotion Adaptation
大規模なラベル付きトレーニングデータのおかげで、ディープニューラルネットワーク(DNN)は、多くのビジョンおよびマルチメディアタスクで目覚ましい成功を収めています。ただし、ドメインシフトが存在するため、十分にトレーニングされたDNNの学習知識を、ラベルがほとんどない新しいドメインまたはデータセットに十分に一般化することはできません。教師なしドメイン適応(UDA)は、あるラベル付きソースドメインでトレーニングされたモデルを別のラベルなしターゲットドメインに転送する問題を調査します。この論文では、感情分布学習と優性感情分類の両方の視覚的感情分析におけるUDAに焦点を当てます。具体的には、CycleEmotionGAN ++と呼ばれる新しいエンドツーエンドのサイクル整合性のある敵対モデルを設計します。まず、CycleGANをマルチスケールの構造化されたサイクル整合性損失で改善することにより、ソースドメインとターゲットドメインをピクセルレベルで整列させるための適応ドメインを生成します。画像の翻訳中に、ソース画像の感情ラベルを保持するために、動的な感情的な意味の一貫性の喪失を提案します。次に、適応ドメインとターゲットドメイン間の機能レベルの調整により、適応ドメインで転送可能なタスク分類子をトレーニングします。分布学習用のFlickr-LDLおよびTwitter-LDLデータセットと、感情分類用のArtPhotoおよびFIデータセットに対して広範なUDA実験を実施します。結果は、最先端のUDAアプローチと比較して、提案されたCycleEmotionGAN ++によってもたらされた大幅な改善を示しています。
Thanks to large-scale labeled training data, deep neural networks (DNNs) have obtained remarkable success in many vision and multimedia tasks. However, because of the presence of domain shift, the learned knowledge of the well-trained DNNs cannot be well generalized to new domains or datasets that have few labels. Unsupervised domain adaptation (UDA) studies the problem of transferring models trained on one labeled source domain to another unlabeled target domain. In this paper, we focus on UDA in visual emotion analysis for both emotion distribution learning and dominant emotion classification. Specifically, we design a novel end-to-end cycle-consistent adversarial model, termed CycleEmotionGAN++. First, we generate an adapted domain to align the source and target domains on the pixel-level by improving CycleGAN with a multi-scale structured cycle-consistency loss. During the image translation, we propose a dynamic emotional semantic consistency loss to preserve the emotion labels of the source images. Second, we train a transferable task classifier on the adapted domain with feature-level alignment between the adapted and target domains. We conduct extensive UDA experiments on the Flickr-LDL & Twitter-LDL datasets for distribution learning and ArtPhoto & FI datasets for emotion classification. The results demonstrate the significant improvements yielded by the proposed CycleEmotionGAN++ as compared to state-of-the-art UDA approaches.
updated: Wed Nov 25 2020 01:31:01 GMT+0000 (UTC)
published: Wed Nov 25 2020 01:31:01 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト