arXiv reaDer
Toward an Automatic System for Computer-Aided Assessment in Facial Palsy
  重要:顔のランドマークのローカリゼーションへの機械学習(ML)アプローチは、写真から関連する顔のメトリックの高スループットの自動定量化を可能にするため、顔の機能の定量的評価に大きな臨床的可能性をもたらします。ただし、研究環境から臨床応用への翻訳には重要な改善が必要です。目的:顔面神経麻痺患者の写真で正確な顔のランドマークを特定するためのMLアルゴリズムを開発し、自動コンピューター支援診断システムの一部として使用する。設計、設定、および参加者:顔のランドマークは、200人の顔面神経麻痺患者と10人のコントロールから得られた8つの表情のポートレート写真に手動でローカライズされました。自動化された顔のランドマークのローカリゼーションのための新しいMLモデルは、この疾患固有のデータベースを使用して訓練されました。モデル出力を手動注釈と比較し、健康な被験者のみで構成される大規模なデータベースを使用してトレーニングしたモデルの出力を比較しました。モデルの精度は、アルゴリズムの予測と手動注釈の間の正規化された二乗平均平方根誤差(NRMSE)によって評価されました。結果:公的に利用可能なアルゴリズムは、健康なコントロールと比較して患者に適用した場合、悪い結果を提供します(NRMSE、8.56 +/- 2.16対7.09 +/- 2.34、p << 0.01)。健康な顔の数千枚以上の画像を使用してトレーニングしたモデル(NRMSE、6.03 +/- 2.43)と比較して、比較的少数の患者の写真を使用してトレーニングしたモデル(1440)を使用すると、臨床集団の顔のランドマークのローカライズ精度が大幅に向上することがわかりましたvs 8.56 +/- 2.16、p << 0.01)。結論:少数の臨床画像でランドマーク検出モデルを再トレーニングすると、臨床集団の正面ビュー写真でのランドマーク検出性能が大幅に向上しました。これらの結果は、顔面神経麻痺のコンピューター支援評価のための自動システムに向けた最初のステップを表しています。
Importance: Machine learning (ML) approaches to facial landmark localization carry great clinical potential for quantitative assessment of facial function as they enable high-throughput automated quantification of relevant facial metrics from photographs. However, translation from research settings to clinical applications requires important improvements. Objective: To develop an ML algorithm for accurate facial landmarks localization in photographs of facial palsy patients, and use it as part of an automated computer-aided diagnosis system. Design, Setting, and Participants: Facial landmarks were manually localized in portrait photographs of eight expressions obtained from 200 facial palsy patients and 10 controls. A novel ML model for automated facial landmark localization was trained using this disease-specific database. Model output was compared to manual annotations and the output of a model trained using a larger database consisting only of healthy subjects. Model accuracy was evaluated by the normalized root mean square error (NRMSE) between algorithms' prediction and manual annotations. Results: Publicly available algorithms provide poor results when applied to patients compared to healthy controls (NRMSE, 8.56 +/- 2.16 vs. 7.09 +/- 2.34, p << 0.01). We found significant improvement in facial landmark localization accuracy for the clinical population when using a model trained with a relatively small number patients' photographs (1440) compared to a model trained using several thousand more images of healthy faces (NRMSE, 6.03 +/- 2.43 vs. 8.56 +/- 2.16, p << 0.01). Conclusions: Retraining a landmark detection model with a small number of clinical images significantly improved landmark detection performance in frontal view photographs of the clinical population. These results represent the first steps towards an automatic system for computer-aided assessment in facial palsy.
updated: Fri Oct 25 2019 02:28:22 GMT+0000 (UTC)
published: Fri Oct 25 2019 02:28:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト