arXiv reaDer
セマンティックセグメンテーションベースの領域認識プーリングを使用した顔画像からのBMIの推定
Estimation of BMI from Facial Images using Semantic Segmentation based Region-Aware Pooling
ボディマス指数(BMI)は、健康や社会経済的状態など、自分の生活に関する重要な情報を伝えます。 BMIの大規模な自動推定は、健康、仕事の機会、友情、人気など、いくつかの社会的行動を予測するのに役立ちます。最近の作品では、顔とBMIの予測に、手作りの幾何学的な顔の特徴または顔レベルの深い畳み込みニューラルネットワークの特徴のいずれかが採用されています。手作りの幾何学的な顔の特徴は一般化可能性に欠けており、顔レベルの深い特徴には詳細なローカル情報がありません。これらの方法は有用ではありますが、正確なBMI予測に不可欠な詳細なローカル情報を見逃していました。この論文では、さまざまな顔領域(目、鼻、眉、唇など)からプールされた深い特徴を使用することを提案し、顔領域からのこの明示的なプールがBMI予測のパフォーマンスを大幅に向上できることを示します。正確でピクセルレベルの顔領域のローカリゼーションの問題に対処するために、フレームワークで顔のセマンティックセグメンテーションを使用することを提案します。 VisualBMI、Bollywood、VIP属性の3つの公開されているデータセットで、FaceNetやVGG-faceなどのさまざまな畳み込みニューラルネットワーク(CNN)バックボーンを使用して広範な実験が実行されます。実験結果は、最近の研究と比較して、提案されたReg-GAPは、VIP属性で22.4%、VisualBMIで3.3%、ボリウッドデータセットで63.09%の改善率を示すことを示しています。
Body-Mass-Index (BMI) conveys important information about one's life such as health and socio-economic conditions. Large-scale automatic estimation of BMIs can help predict several societal behaviors such as health, job opportunities, friendships, and popularity. The recent works have either employed hand-crafted geometrical face features or face-level deep convolutional neural network features for face to BMI prediction. The hand-crafted geometrical face feature lack generalizability and face-level deep features don't have detailed local information. Although useful, these methods missed the detailed local information which is essential for exact BMI prediction. In this paper, we propose to use deep features that are pooled from different face regions (eye, nose, eyebrow, lips, etc.,) and demonstrate that this explicit pooling from face regions can significantly boost the performance of BMI prediction. To address the problem of accurate and pixel-level face regions localization, we propose to use face semantic segmentation in our framework. Extensive experiments are performed using different Convolutional Neural Network (CNN) backbones including FaceNet and VGG-face on three publicly available datasets: VisualBMI, Bollywood and VIP attributes. Experimental results demonstrate that, as compared to the recent works, the proposed Reg-GAP gives a percentage improvement of 22.4% on VIP-attribute, 3.3% on VisualBMI, and 63.09% on the Bollywood dataset.
updated: Sat Apr 10 2021 10:53:21 GMT+0000 (UTC)
published: Sat Apr 10 2021 10:53:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト