arXiv reaDer
敵対的学習による複数の顔分析
Multiple Face Analyses through Adversarial Learning
 ランドマーク検出、頭部姿勢推定、性別認識、顔属性推定などの複数の顔分析タスク間のこの固有の関係は、各タスクのパフォーマンスを向上させるために重要ですが、通常、これらの複数の顔分析タスクは次のように処理されるため、徹底的に調査されていません個別のタスク。本論文では、顔のランドマークを特定し、頭部姿勢を推定し、性別を共同で認識する、または画像表現レベルとラベルレベルの両方から依存関係を探索することにより、複数の顔属性を同時に推定するための、新しいディープマルチタスク敵対学習法を提案します。具体的には、提案された方法は、深層認識ネットワークRと弁別器Dで構成されています。深層認識ネットワークは、共有中レベル画像表現を学習し、複数の顔分析タスクを同時に実行します。マルチタスク学習メカニズムにより、認識ネットワークは、顔のランドマークの位置特定、頭部姿勢推定、性別認識、画像表現レベルからの顔属性推定など、複数の顔分析タスク間の依存関係を調査します。識別器は、グラウンドトゥルースラベルに固有のものに収束するために、複数の顔分析タスクの分散を強制するために導入されます。トレーニング中に、認識エンジンは識別器を混同しようとしますが、識別ディスクは予測ラベルの組み合わせを地上の真実の組み合わせと区別することで認識エンジンと競合します。敵対的な学習ではありますが、ラベルレベルからの複数の顔分析タスク間の依存関係を調査します。 4つのベンチマークデータベース、つまりAFLWデータベース、Multi-PIEデータベース、CelebAデータベース、LFWAデータベースの実験結果は、複数の顔分析に対する提案された方法の有効性を示しています。
This inherent relations among multiple face analysis tasks, such as landmark detection, head pose estimation, gender recognition and face attribute estimation are crucial to boost the performance of each task, but have not been thoroughly explored since typically these multiple face analysis tasks are handled as separate tasks. In this paper, we propose a novel deep multi-task adversarial learning method to localize facial landmark, estimate head pose and recognize gender jointly or estimate multiple face attributes simultaneously through exploring their dependencies from both image representation-level and label-level. Specifically, the proposed method consists of a deep recognition network R and a discriminator D. The deep recognition network is used to learn the shared middle-level image representation and conducts multiple face analysis tasks simultaneously. Through multi-task learning mechanism, the recognition network explores the dependencies among multiple face analysis tasks, such as facial landmark localization, head pose estimation, gender recognition and face attribute estimation from image representation-level. The discriminator is introduced to enforce the distribution of the multiple face analysis tasks to converge to that inherent in the ground-truth labels. During training, the recognizer tries to confuse the discriminator, while the discriminator competes with the recognizer through distinguishing the predicted label combination from the ground-truth one. Though adversarial learning, we explore the dependencies among multiple face analysis tasks from label-level. Experimental results on four benchmark databases, i.e., the AFLW database, the Multi-PIE database, the CelebA database and the LFWA database, demonstrate the effectiveness of the proposed method for multiple face analyses.
updated: Mon Nov 18 2019 04:24:17 GMT+0000 (UTC)
published: Mon Nov 18 2019 04:24:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト