この論文では、含まれている人間の骨格姿勢を推定するために、2 次元カメラ フレームからクォータニオンを抽出する新しいアルゴリズムを提示します。姿勢推定の問題は、通常、3D 空間内の点を測定するための深度とユークリッド距離を取得するために、ステレオ カメラと中間測定ユニットを使用することで対処されます。ただし、これらのデバイスを使用すると、信号処理の遅延が大きくなり、多額の金銭的コストが発生します。人間の姿勢を推定するための認識パイプラインを構築するためのフレームワークである MediaPipe を利用することにより、提案されたアルゴリズムは、50 ミリ秒未満のレイテンシで人間のオブジェクトの画像をキャプチャする 2D フレームからクォータニオンを抽出し、同時に展開することもできます。特に、自律型ロボットによる土壇場での検出と反応を伴うユースケースでは、単一のカメラ フレームと一般的に低い計算リソースの可用性を備えたエッジ。このアルゴリズムは、資金調達の障壁を回避し、制御システムの設計に携わるロボット研究者のアクセシビリティを改善しようとしています。
In this paper, we present a novel algorithm to extract a quaternion from a two dimensional camera frame for estimating a contained human skeletal pose. The problem of pose estimation is usually tackled through the usage of stereo cameras and intertial measurement units for obtaining depth and euclidean distance for measurement of points in 3D space. However, the usage of these devices comes with a high signal processing latency as well as a significant monetary cost. By making use of MediaPipe, a framework for building perception pipelines for human pose estimation, the proposed algorithm extracts a quaternion from a 2-D frame capturing an image of a human object at a sub-fifty millisecond latency while also being capable of deployment at edges with a single camera frame and a generally low computational resource availability, especially for use cases involving last-minute detection and reaction by autonomous robots. The algorithm seeks to bypass the funding barrier and improve accessibility for robotics researchers involved in designing control systems.