arXiv reaDer
HMD-EgoPose:ヘッドマウントディスプレイベースの自己中心性マーカーレスツールおよび拡張手術ガイダンスのための手のポーズ推定
HMD-EgoPose: Head-Mounted Display-Based Egocentric Marker-Less Tool and Hand Pose Estimation for Augmented Surgical Guidance
最新のコンピューター支援手術手順の成功または失敗は、追跡される器具および組織の正確な6自由度(6DoF)の位置および方向(ポーズ)の推定に依存します。この論文では、HMD-EgoPoseを紹介します。これは、手とオブジェクトのポーズ推定へのシングルショット学習ベースのアプローチであり、単眼赤-緑-青(RGB)6DoFマーカーのベンチマークデータセットで最先端のパフォーマンスを示します。 -手や手術器具のポーズ追跡が少なくなります。さらに、低遅延ストリーミングアプローチを通じて、市販の光学シースルーヘッドマウントディスプレイ(OST-HMD)でパフォーマンスの高い6DoFポーズ推定を行うためのHMD-EgoPoseフレームワークの容量を明らかにします。私たちのフレームワークは、マルチスケールの特徴抽出と一連のサブネットワークに効率的な畳み込みニューラルネットワーク(CNN)バックボーンを利用して、硬い外科用ドリル器具の6DoFポーズ表現とユーザーの手の握り方を共同で学習しました。市販のOST-HMDであるMicrosoftHoloLens2にアプローチを利用できるようにするために、ネットワーク推論を最適化できる高性能コンピューティングワークステーションを使用して、低遅延のビデオおよびデータ通信用のパイプラインを作成しました。 HMD-EgoPoseは、手術器具のポーズ推定のベンチマークデータセットで現在の最先端のアプローチを上回り、実際のデータで11.0 mmの平均ツール3D頂点誤差を達成し、臨床的に実行可能なマーカーフリー追跡戦略に向けた進歩を促進します。低レイテンシのストリーミングアプローチにより、OST-HMDと統合した場合に、ポーズ推定と追跡モデルの視覚化の強化のために、199.1ミリ秒のラウンドトリップレイテンシを達成しました。私たちのシングルショット学習アプローチは、オクルージョンや複雑な表面に対して堅牢であり、マーカーレスツールと手のポーズ推定に対する現在の最先端のアプローチを改善しました。
The success or failure of modern computer-assisted surgery procedures hinges on the precise six-degree-of-freedom (6DoF) position and orientation (pose) estimation of tracked instruments and tissue. In this paper, we present HMD-EgoPose, a single-shot learning-based approach to hand and object pose estimation and demonstrate state-of-the-art performance on a benchmark dataset for monocular red-green-blue (RGB) 6DoF marker-less hand and surgical instrument pose tracking. Further, we reveal the capacity of our HMD-EgoPose framework for performant 6DoF pose estimation on a commercially available optical see-through head-mounted display (OST-HMD) through a low-latency streaming approach. Our framework utilized an efficient convolutional neural network (CNN) backbone for multi-scale feature extraction and a set of subnetworks to jointly learn the 6DoF pose representation of the rigid surgical drill instrument and the grasping orientation of the hand of a user. To make our approach accessible to a commercially available OST-HMD, the Microsoft HoloLens 2, we created a pipeline for low-latency video and data communication with a high-performance computing workstation capable of optimized network inference. HMD-EgoPose outperformed current state-of-the-art approaches on a benchmark dataset for surgical tool pose estimation, achieving an average tool 3D vertex error of 11.0 mm on real data and furthering the progress towards a clinically viable marker-free tracking strategy. Through our low-latency streaming approach, we achieved a round trip latency of 199.1 ms for pose estimation and augmented visualization of the tracked model when integrated with the OST-HMD. Our single-shot learned approach was robust to occlusion and complex surfaces and improved on current state-of-the-art approaches to marker-less tool and hand pose estimation.
updated: Fri May 20 2022 14:12:26 GMT+0000 (UTC)
published: Thu Feb 24 2022 04:07:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト