arXiv reaDer
異方性球面ガウシアンを使用した顔のポーズ推定のための偏りのないラベル分布学習に向けて
Towards Unbiased Label Distribution Learning for Facial Pose Estimation Using Anisotropic Spherical Gaussian
顔の姿勢の推定とは、単一の RGB 画像から顔の向きを予測するタスクを指します。これは、コンピューター ビジョンで幅広い用途を持つ重要な研究トピックです。ラベル分布学習 (LDL) ベースの方法は、最近、顔の姿勢推定のために提案されており、有望な結果を達成しています。ただし、既存の LDL メソッドには 2 つの大きな問題があります。まず、ラベル分布の期待値に偏りがあり、偏ったポーズ推定につながります。次に、すべての学習サンプルに固定分布パラメーターが適用され、モデルの機能が大幅に制限されます。この論文では、顔のポーズ推定のための異方性球面ガウス (ASG) ベースの LDL アプローチを提案します。特に、私たちのアプローチは、偏りのない期待値を常に生成する単位球面上の球面ガウス分布を採用しています。一方、ネットワークが各学習サンプルの分布パラメーターを柔軟に学習できるようにする新しい損失関数を導入します。広範な実験結果は、私たちの方法が AFLW2000 および BIWI データセットに新しい最先端の記録を設定することを示しています。
Facial pose estimation refers to the task of predicting face orientation from a single RGB image. It is an important research topic with a wide range of applications in computer vision. Label distribution learning (LDL) based methods have been recently proposed for facial pose estimation, which achieve promising results. However, there are two major issues in existing LDL methods. First, the expectations of label distributions are biased, leading to a biased pose estimation. Second, fixed distribution parameters are applied for all learning samples, severely limiting the model capability. In this paper, we propose an Anisotropic Spherical Gaussian (ASG)-based LDL approach for facial pose estimation. In particular, our approach adopts the spherical Gaussian distribution on a unit sphere which constantly generates unbiased expectation. Meanwhile, we introduce a new loss function that allows the network to learn the distribution parameter for each learning sample flexibly. Extensive experimental results show that our method sets new state-of-the-art records on AFLW2000 and BIWI datasets.
updated: Fri Aug 19 2022 02:12:36 GMT+0000 (UTC)
published: Fri Aug 19 2022 02:12:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト