arXiv reaDer
手術ビデオでの一時的にガイドされた関節式手のポーズ追跡
Temporally Guided Articulated Hand Pose Tracking in Surgical Videos
関節式の手のポーズ追跡は、特に医療分野で、多数のアプリケーションで使用される可能性を秘めた未踏の問題です。生体内の手術ビデオの堅牢で正確な追跡システムを使用すると、手の動きのダイナミクスと動きのパターンをキャプチャして、多くの豊富なタスクについて分析できます。この作業では、新しい手のポーズ推定モデルであるRes152-CondPoseを提案します。これは、ポーズ予測に事前に手のポーズを組み込むことにより、検出と追跡の精度を向上させます。過去の予測を効果的に活用する時間的にガイドされたアプローチに従うことにより、フレームごとに独立した予測を提供する最先端の方法に対する改善を示します。さらに、最初のデータセットであるSurgical Handsを収集します。これは、生体内ビデオのマルチインスタンス関節式手のポーズ注釈を提供します。私たちのデータセットには、28の公開されている手術ビデオからの76のビデオクリップと8.1kを超える注釈付きの手のポーズインスタンスが含まれています。バウンディングボックス、関節式の手のポーズの注釈、および追跡IDを提供して、マルチインスタンスのエリアベースの関節式の追跡を可能にします。 Surgical Handsで評価した場合、ポーズ推定精度を測定するための平均平均精度(mAP)と、ポーズ追跡パフォーマンスを評価するための複数オブジェクト追跡精度(MOTA)を使用して、この方法が最先端の方法よりも優れていることを示します。コードとデータセットの両方は、https://github.com/MichiganCOG/Surgical_Hands_RELEASEで入手できます。
Articulated hand pose tracking is an under-explored problem that carries the potential for use in an extensive number of applications, especially in the medical domain. With a robust and accurate tracking system on in-vivo surgical videos, the motion dynamics and movement patterns of the hands can be captured and analyzed for many rich tasks. In this work, we propose a novel hand pose estimation model, Res152-CondPose, which improves detection and tracking accuracy by incorporating a hand pose prior into its pose prediction. We show improvements over state-of-the-art methods which provide frame-wise independent predictions, by following a temporally guided approach that effectively leverages past predictions. Additionally, we collect the first dataset, Surgical Hands, that provides multi-instance articulated hand pose annotations for in-vivo videos. Our dataset contains 76 video clips from 28 publicly available surgical videos and over 8.1k annotated hand pose instances. We provide bounding boxes, articulated hand pose annotations, and tracking IDs to enable multi-instance area-based and articulated tracking. When evaluated on Surgical Hands, we show our method outperforms the state-of-the-art method using mean Average Precision (mAP), to measure pose estimation accuracy, and Multiple Object Tracking Accuracy (MOTA), to assess pose tracking performance. Both the code and dataset are available at https://github.com/MichiganCOG/Surgical_ Hands_RELEASE.
updated: Wed Oct 20 2021 21:20:44 GMT+0000 (UTC)
published: Tue Jan 12 2021 03:44:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト