SalGaze: Personalizing Gaze Estimation Using Visual Saliency
  従来の視線推定方法では、通常、高精度を実現するために明示的なユーザーキャリブレーションが必要です。このプロセスは面倒であり、照明やポーズなどの要因に変化がある場合、再キャリブレーションが必要になることがよくあります。この課題に対処するために、視覚コンテンツの顕著性情報を利用して、明示的なユーザーキャリブレーションなしでユーザーに視線推定アルゴリズムを透過的に適応させるフレームワークであるSalGazeを導入します。 CNNベースのモデルの最適化に使用できる顕著性マップを微分可能な損失マップに変換するアルゴリズムを設計します。 SalGazeは、統一されたフレームワークを使用して、暗黙的なビデオ顕著性キャリブレーションデータで標準ポイントキャリブレーションデータを大幅に増強することもできます。既存の方法でこの手法を使用すると、精度が24%以上向上します。
Traditional gaze estimation methods typically require explicit user calibration to achieve high accuracy. This process is cumbersome and recalibration is often required when there are changes in factors such as illumination and pose. To address this challenge, we introduce SalGaze, a framework that utilizes saliency information in the visual content to transparently adapt the gaze estimation algorithm to the user without explicit user calibration. We design an algorithm to transform a saliency map into a differentiable loss map that can be used for the optimization of CNN-based models. SalGaze is also able to greatly augment standard point calibration data with implicit video saliency calibration data using a unified framework. We show accuracy improvements over 24% using our technique on existing methods.
updated: Wed Oct 23 2019 15:11:08 GMT+0000 (UTC)
published: Wed Oct 23 2019 15:11:08 GMT+0000 (UTC)
