arXiv reaDer
胎児アルコール症候群認識への応用を伴う正則化された転移学習を使用した顔の解剖学的ランドマーク検出
Facial Anatomical Landmark Detection using Regularized Transfer Learning with Application to Fetal Alcohol Syndrome Recognition
出生前のアルコール曝露によって引き起こされる胎児性アルコール症候群(FAS)は、一連の頭蓋顔面の異常、および行動と神経認知の問題を引き起こす可能性があります。 FASの現在の診断は、通常、顔の特徴のセットを特定することによって行われます。これらの特徴は、多くの場合、手動検査によって取得されます。豊富な幾何学的情報を提供する解剖学的ランドマーク検出は、FAS関連の顔の異常の存在を検出するために重要です。このイメージングアプリケーションは、データの外観に大きなばらつきがあり、ラベル付けされたデータの可用性が限られていることを特徴としています。自然画像での顔のランドマーク検出用に設計された現在の深層学習ベースのヒートマップ回帰法は、大規模なデータセットの可用性を前提としているため、このアプリケーションには適していません。この制限に対処するために、大規模な顔認識データセットで学習したネットワークの知識を活用する、新しい正規化された転送学習アプローチを開発します。事前にトレーニングされた重みの調整に焦点を当てた標準的な転移学習とは対照的に、提案された学習アプローチはモデルの動作を正規化します。ランドマーク検出の最適化を正規化するための追加の監視信号として、ターゲットタスクデータ上のドメイン類似ソースモデルの豊富な視覚的セマンティクスを明示的に再利用します。具体的には、分類層と中間層からの特徴出力の制約、および空間レベルとチャネルレベルの両方でのアクティブ化注意マップのマッチングを含む、提案された伝達学習の4つの正則化制約を開発します。収集された臨床画像データセットの実験的評価は、提案されたアプローチが限られたトレーニングサンプルの下でモデルの一般化可能性を効果的に改善でき、文献の他のアプローチに有利であることを示しています。
Fetal alcohol syndrome (FAS) caused by prenatal alcohol exposure can result in a series of cranio-facial anomalies, and behavioral and neurocognitive problems. Current diagnosis of FAS is typically done by identifying a set of facial characteristics, which are often obtained by manual examination. Anatomical landmark detection, which provides rich geometric information, is important to detect the presence of FAS associated facial anomalies. This imaging application is characterized by large variations in data appearance and limited availability of labeled data. Current deep learning-based heatmap regression methods designed for facial landmark detection in natural images assume availability of large datasets and are therefore not wellsuited for this application. To address this restriction, we develop a new regularized transfer learning approach that exploits the knowledge of a network learned on large facial recognition datasets. In contrast to standard transfer learning which focuses on adjusting the pre-trained weights, the proposed learning approach regularizes the model behavior. It explicitly reuses the rich visual semantics of a domain-similar source model on the target task data as an additional supervisory signal for regularizing landmark detection optimization. Specifically, we develop four regularization constraints for the proposed transfer learning, including constraining the feature outputs from classification and intermediate layers, as well as matching activation attention maps in both spatial and channel levels. Experimental evaluation on a collected clinical imaging dataset demonstrate that the proposed approach can effectively improve model generalizability under limited training samples, and is advantageous to other approaches in the literature.
updated: Sun Sep 12 2021 11:05:06 GMT+0000 (UTC)
published: Sun Sep 12 2021 11:05:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト