arXiv reaDer
クロスドメイン表情認識:統一された評価ベンチマークと敵対的グラフ学習
Cross-Domain Facial Expression Recognition: A Unified Evaluation Benchmark and Adversarial Graph Learning
さまざまな表情認識(FER)データセット間のデータの不整合の問題に対処するために、近年、多くのクロスドメインFERメソッド(CD-FER)が広く考案されています。それぞれが優れたパフォーマンスを達成することを宣言していますが、ソース/ターゲットデータセットと特徴抽出器の選択に一貫性がないため、公正な比較が不足しています。この作業では、最初にこれらの一貫性のない選択によって引き起こされるパフォーマンスへの影響を分析し、次にいくつかのパフォーマンスの高いCD-FERおよび最近公開されたドメイン適応アルゴリズムを再実装します。これらすべてのアルゴリズムが、公正なCD-FER評価のために同じソースデータセットと特徴抽出器を採用することを保証します。現在の主要なアルゴリズムのほとんどは、敵対的学習を使用して、ドメインシフトを軽減するための全体的なドメイン不変機能を学習していることがわかります。ただし、これらのアルゴリズムはローカル機能を無視します。ローカル機能は、さまざまなデータセット間でより転送可能であり、きめ細かい適応のためのより詳細なコンテンツを伝送します。これらの問題に対処するために、新しい敵対的グラフ表現適応(AGRA)フレームワークを開発することにより、グラフ表現の伝播をクロスドメインの全体的-局所的特徴の共適応のための敵対的学習と統合します。具体的には、最初に2つのグラフを作成して、各ドメイン内および異なるドメイン間でそれぞれ全体的領域とローカル領域を相関させます。次に、入力画像から全体的な局所特徴を抽出し、学習可能なクラスごとの統計分布を使用して、対応するグラフノードを初期化します。最後に、2つのスタックグラフ畳み込みネットワーク(GCN)を採用して、各ドメイン内でホリスティックローカル機能を伝播し、ホリスティックローカル機能の共適応のためにそれらの相互作用を調査します。いくつかの一般的なベンチマークについて広範囲かつ公正な評価を実施し、提案されたAGRAフレームワークが以前の最先端の方法よりも優れていることを示しています。
To address the problem of data inconsistencies among different facial expression recognition (FER) datasets, many cross-domain FER methods (CD-FERs) have been extensively devised in recent years. Although each declares to achieve superior performance, fair comparisons are lacking due to the inconsistent choices of the source/target datasets and feature extractors. In this work, we first analyze the performance effect caused by these inconsistent choices, and then re-implement some well-performing CD-FER and recently published domain adaptation algorithms. We ensure that all these algorithms adopt the same source datasets and feature extractors for fair CD-FER evaluations. We find that most of the current leading algorithms use adversarial learning to learn holistic domain-invariant features to mitigate domain shifts. However, these algorithms ignore local features, which are more transferable across different datasets and carry more detailed content for fine-grained adaptation. To address these issues, we integrate graph representation propagation with adversarial learning for cross-domain holistic-local feature co-adaptation by developing a novel adversarial graph representation adaptation (AGRA) framework. Specifically, it first builds two graphs to correlate holistic and local regions within each domain and across different domains, respectively. Then, it extracts holistic-local features from the input image and uses learnable per-class statistical distributions to initialize the corresponding graph nodes. Finally, two stacked graph convolution networks (GCNs) are adopted to propagate holistic-local features within each domain to explore their interaction and across different domains for holistic-local feature co-adaptation. We conduct extensive and fair evaluations on several popular benchmarks and show that the proposed AGRA framework outperforms previous state-of-the-art methods.
updated: Tue Nov 30 2021 06:29:31 GMT+0000 (UTC)
published: Mon Aug 03 2020 15:00:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト