画像からの年齢推定は、多くの実用的なシーンで使用できます。これまでの作品のほとんどは、顔が1つしかない画像からの推定を対象としていました。また、年齢推定用のオープンデータセットのほとんどには、そのような画像が含まれています。ただし、状況によっては、野生および複数人の年齢の推定が必要になります。通常、このような状況は2つの別々のモデルによって解決されました。 1つは顔の領域をトリミングする顔検出器モデルで、もう1つはトリミングされた画像から推定する年齢推定モデルです。本研究では、顔に焦点を当てながら周囲を見ながら年齢を推定する単一モデルで、複数人の年齢を検出・推定できる手法を提案します。また、片方の顔だけを撮影した画像で訓練しても、モデルが複数人をうまく推定できる訓練方法を提案します。実験では、2つの別々のモデルを使用した従来のアプローチと比較して提案された方法を評価しました。その結果、提案手法により精度を高めることができた。また、提案されたモデルを、一般的に使用される1人の写真による年齢推定データセットに適合させました。この方法は、これらの画像にも有効であり、最先端の精度を上回っています。
Age estimation from images can be used in many practical scenes. Most of the previous works targeted on the estimation from images in which only one face exists. Also, most of the open datasets for age estimation contain images like that. However, in some situations, age estimation in the wild and for multi-person is needed. Usually, such situations were solved by two separate models; one is a face detector model which crops facial regions and the other is an age estimation model which estimates from cropped images. In this work, we propose a method that can detect and estimate the age of multi-person with a single model which estimates age with focusing on faces and still seeing surroundings. Also, we propose a training method which enables the model to estimate multi-person well despite trained with images in which only one face is photographed. In the experiments, we evaluated our proposed method compared with the traditional approach using two separate models. As the result, the accuracy could be enhanced with our proposed method. We also adapted our proposed model to commonly used single person photographed age estimation datasets and it is proved that our method is also effective to those images and outperforms the state of the art accuracy.