追加の仮定なしで単眼画像から人の身長を推定することは不適切です。既存のソリューションでは、グランドプレーンとカメラジオメトリ、特殊なカメラ、または既知のサイズの参照オブジェクトの手動キャリブレーションが必要です。モーションキューに焦点を当て、地球上の重力を遍在する参照「オブジェクト」として利用して、イメージピクセルで測定された加速度と、その後の高さをメートル単位の値に変換します。入力としてモーションのビデオが必要です。この場合、重力のみが外力です。この制限は、人の身長を回復する既存のソリューションの制限とは異なるため、この方法は新しいアプリケーションフィールドを開きます。ピクセル測定値から人のメートル法の身長に変換するには、単純な運動軌跡解析で十分であり、ジャンプ運動で最大3.9 cmのMAEに達し、カメラと地面のキャリブレーションなしで機能することを理論的および経験的に示します。
Estimating the metric height of a person from monocular imagery without additional assumptions is ill-posed. Existing solutions either require manual calibration of ground plane and camera geometry, special cameras, or reference objects of known size. We focus on motion cues and exploit gravity on earth as an omnipresent reference 'object' to translate acceleration, and subsequently height, measured in image-pixels to values in meters. We require videos of motion as input, where gravity is the only external force. This limitation is different to those of existing solutions that recover a person's height and, therefore, our method opens up new application fields. We show theoretically and empirically that a simple motion trajectory analysis suffices to translate from pixel measurements to the person's metric height, reaching a MAE of up to 3.9 cm on jumping motions, and that this works without camera and ground plane calibration.