顔の特徴は有用な情報を提供するため、コンピュータービジョンの研究者は顔の画像から年齢を推定することを好みます。ただし、顔の画像から年齢を推定することは、人々がカメラから遠い場合や遮蔽されている場合は困難になります。人の歩容は、遠くからでも効率的に知覚できるユニークな生体認証機能です。したがって、歩行を使用して、顔画像が利用できない年齢を予測できます。ただし、既存の歩行ベースの分類または回帰方法では、年齢の順序関係を無視します。これは、年齢推定の重要な手がかりです。本論文では、歩行ベースの年齢推定のために、グローバルおよびローカル畳み込みニューラルネットワークを使用した順序分布回帰を提案します。具体的には、歩行ベースの年齢回帰を一連のバイナリ分類に分解して、順序年齢情報を組み込みます。次に、推定値とグラウンドトゥルース間の分布の不一致にペナルティを科すことにより、これらの分類間の内部関係を考慮するために順序分布損失を提案します。さらに、私たちのニューラルネットワークは、グローバルおよび3つのローカルサブネットワークで構成されているため、頭、体、足からグローバル構造とローカル詳細を学習できます。実験結果は、提案されたアプローチが、OULP-Ageデータセットでの最先端の歩行ベースの年齢推定方法よりも優れていることを示しています。
Computer vision researchers prefer to estimate age from face images because facial features provide useful information. However, estimating age from face images becomes challenging when people are distant from the camera or occluded. A person's gait is a unique biometric feature that can be perceived efficiently even at a distance. Thus, gait can be used to predict age when face images are not available. However, existing gait-based classification or regression methods ignore the ordinal relationship of different ages, which is an important clue for age estimation. This paper proposes an ordinal distribution regression with a global and local convolutional neural network for gait-based age estimation. Specifically, we decompose gait-based age regression into a series of binary classifications to incorporate the ordinal age information. Then, an ordinal distribution loss is proposed to consider the inner relationships among these classifications by penalizing the distribution discrepancy between the estimated value and the ground truth. In addition, our neural network comprises a global and three local sub-networks, and thus, is capable of learning the global structure and local details from the head, body, and feet. Experimental results indicate that the proposed approach outperforms state-of-the-art gait-based age estimation methods on the OULP-Age dataset.