arXiv reaDer
非局所的な3D注意ネットワークによる毎日の顔の疲労に対するマシンビジョン検出
Machine vision detection to daily facial fatigue with a nonlocal 3D attention network
倦怠感の検出は、メンタルヘルスを維持し、安全事故を防ぐために重要です。ただし、顔の倦怠感、特にマシンビジョンを介した現実世界の軽度の倦怠感の検出は、ラボ以外のデータセットと明確に定義されたアルゴリズムがないため、依然として困難な問題です。日常生活で広く利用できる顔面疲労の検出能力を向上させるために、本稿では、野生の人々の顔面疲労状態を反映したDLFD(日常生活疲労データセット)という視聴覚データセットを提供しました。非局所的注意メカニズムとともに3D-ResNetを使用するフレームワークは、空間的および時間的次元で局所的および長距離の特徴を抽出するためのトレーニングでした。次に、平均二乗誤差とクロスエントロピーを組み合わせた圧縮損失関数を設計して、連続疲労度とカテゴリ疲労度の両方を予測しました。提案されたフレームワークは、バイナリ分類の検証セットで90.8%、テストセットで72.5%の平均精度に達し、他の最先端の方法と比較して良好な位置にあります。特徴マップの視覚化の分析により、私たちのフレームワークが顔のダイナミクスをキャプチャし、疲労状態との関係を構築しようとしたことが明らかになりました。複数のメトリックでの実験結果は、フレームワークが時空間次元に沿っていくつかの典型的なミクロおよび動的な顔の特徴をキャプチャし、野生の軽度の疲労感の検出に貢献していることを証明しました。
Fatigue detection is valued for people to keep mental health and prevent safety accidents. However, detecting facial fatigue, especially mild fatigue in the real world via machine vision is still a challenging issue due to lack of non-lab dataset and well-defined algorithms. In order to improve the detection capability on facial fatigue that can be used widely in daily life, this paper provided an audiovisual dataset named DLFD (daily-life fatigue dataset) which reflected people's facial fatigue state in the wild. A framework using 3D-ResNet along with non-local attention mechanism was training for extraction of local and long-range features in spatial and temporal dimensions. Then, a compacted loss function combining mean squared error and cross-entropy was designed to predict both continuous and categorical fatigue degrees. Our proposed framework has reached an average accuracy of 90.8% on validation set and 72.5% on test set for binary classification, standing a good position compared to other state-of-the-art methods. The analysis of feature map visualization revealed that our framework captured facial dynamics and attempted to build a connection with fatigue state. Our experimental results in multiple metrics proved that our framework captured some typical, micro and dynamic facial features along spatiotemporal dimensions, contributing to the mild fatigue detection in the wild.
updated: Wed Apr 21 2021 08:58:46 GMT+0000 (UTC)
published: Wed Apr 21 2021 08:58:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト