arXiv reaDer
MERANet:3D残余注意ネットワークを使用した顔のマイクロエクスプレッション認識
MERANet: Facial Micro-Expression Recognition using 3D Residual Attention Network
マイクロエクスプレッションは、感情検出におけるその高い客観性により、感情コンピューティングにおける有望なモダリティとして浮上しています。深層学習モデルによって提供されるより高い認識精度にもかかわらず、マイクロエクスプレッション認識技術にはまだ大きな改善の余地があります。顔の小さな局所領域におけるマイクロエクスプレッションの存在、および利用可能なデータベースの限られたサイズは、マイクロエクスプレッションを認識する際の精度を制限し続けています。本研究では、このような課題に取り組むために、MERANetという名前の3D残余注意ネットワークを使用した顔のマイクロエクスプレッション認識モデルを提案します。提案されたモデルは、時空間的注意とチャネル注意を一緒に利用して、感情の分類のためのより詳細な微妙な特徴を学習します。さらに、提案されたモデルは、3Dカーネルと残余接続を同時に使用して空間情報と時間情報の両方を包含します。さらに、チャネルの特徴と時空間の特徴は、各残余モジュールでそれぞれチャネルと時空間の注意を使用して再較正されます。私たちの注意メカニズムにより、モデルはさまざまな顔の関心領域に焦点を当てることを学ぶことができます。実験は、ベンチマークの顔のマイクロエクスプレッションデータセットで実施されます。ベンチマークデータでの顔のマイクロエクスプレッション認識の最先端技術と比較して、優れたパフォーマンスが観察されます。
Micro-expression has emerged as a promising modality in affective computing due to its high objectivity in emotion detection. Despite the higher recognition accuracy provided by the deep learning models, there are still significant scope for improvements in micro-expression recognition techniques. The presence of micro-expressions in small-local regions of the face, as well as the limited size of available databases, continue to limit the accuracy in recognizing micro-expressions. In this work, we propose a facial micro-expression recognition model using 3D residual attention network named MERANet to tackle such challenges. The proposed model takes advantage of spatial-temporal attention and channel attention together, to learn deeper fine-grained subtle features for classification of emotions. Further, the proposed model encompasses both spatial and temporal information simultaneously using the 3D kernels and residual connections. Moreover, the channel features and spatio-temporal features are re-calibrated using the channel and spatio-temporal attentions, respectively in each residual module. Our attention mechanism enables the model to learn to focus on different facial areas of interest. The experiments are conducted on benchmark facial micro-expression datasets. A superior performance is observed as compared to the state-of-the-art for facial micro-expression recognition on benchmark data.
updated: Sun Jan 23 2022 05:45:59 GMT+0000 (UTC)
published: Mon Dec 07 2020 16:41:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト