Fast and Effective Adaptation of Facial Action Unit Detection Deep Model
 顔の動作単位(AU)を検出することは、感情や認知状態の顔の表情を自動的に認識する基本的な手順の1つです。このタスクにはさまざまなアプローチが提案されていますが、これらのモデルのほとんどは特定のターゲットAUに対してのみトレーニングされているため、新しいAUの認識タスク(つまり、最初に使用されなかったもの)に簡単に適応できませんターゲットモデルをトレーニングします)。この論文では、新しいタスク(AUまたは被験者)からラベル付けされたサンプルのみを活用することにより、新しいAUまたはターゲット被験者に簡単かつ迅速に適応できる、顔AU検出のディープラーニングアプローチを提案します。この目的のために、一般的な画像認識/検出タスク(たとえば、Omniglotデータセットからの文字認識)のために最初に提案された、モデルに依存しないメタ学習の概念に基づくモデリングアプローチを提案します。具体的には、各被験者および/またはAUは新しい学習タスクとして扱われ、モデルは以前のタスク(ターゲットモデルの事前トレーニングに使用されたAUおよび被験者)の知識に基づいて適応することを学習します。したがって、新しいサブジェクトまたはAUが与えられると、このメタ知識(トレーニングタスクとテストタスクで共有されます)を使用して、ディープラーニングとモデルに依存しないメタ学習の概念を使用して、モデルを新しいタスクに適合させます顔のAU検出のための2つのベンチマークデータセット(BP4DおよびDISFA)で、提案されたアプローチを新しいタスク(AU /被験者)に簡単に適応できることを示します。これらのタスクからラベル付けされたいくつかの例を使用するだけで、モデルはベースライン(つまり、非適応モデル)を大幅に改善します。
Detecting facial action units (AU) is one of the fundamental steps in automatic recognition of facial expression of emotions and cognitive states. Though there have been a variety of approaches proposed for this task, most of these models are trained only for the specific target AUs, and as such they fail to easily adapt to the task of recognition of new AUs (i.e., those not initially used to train the target models). In this paper, we propose a deep learning approach for facial AU detection that can easily and in a fast manner adapt to a new AU or target subject by leveraging only a few labeled samples from the new task (either an AU or subject). To this end, we propose a modeling approach based on the notion of the model-agnostic meta-learning, originally proposed for the general image recognition/detection tasks (e.g., the character recognition from the Omniglot dataset). Specifically, each subject and/or AU is treated as a new learning task and the model learns to adapt based on the knowledge of the previous tasks (the AUs and subjects used to pre-train the target models). Thus, given a new subject or AU, this meta-knowledge (that is shared among training and test tasks) is used to adapt the model to the new task using the notion of deep learning and model-agnostic meta-learning. We show on two benchmark datasets (BP4D and DISFA) for facial AU detection that the proposed approach can be easily adapted to new tasks (AUs/subjects). Using only a few labeled examples from these tasks, the model achieves large improvements over the baselines (i.e., non-adapted models).
updated: Wed Nov 27 2019 14:13:31 GMT+0000 (UTC)
published: Thu Sep 26 2019 14:42:27 GMT+0000 (UTC)
