目的:繊細で低侵襲の側頭骨手術には、手術器具の位置と方向(ポーズ)を正確に推定することが重要です。現在の技術は、精度および/または視線の制約に欠けている(従来の追跡システム)か、患者を禁止的な電離放射線にさらす(術中CT)。可能な解決策は、不規則な間隔でCアームを使用して機器をキャプチャし、画像からポーズを復元することです。方法:i3PosNetは、姿勢推定ネットワークを使用して、画像から器具の位置と方向を推測します。このフレームワークは、ローカライズされたパッチを考慮し、擬似ランドマークを出力します。ポーズは、幾何学的な考慮によって疑似ランドマークから再構築されます。結果:i3PosNetが0.05mm未満のエラーに達することを示しています。従来の画像登録ベースのアプローチよりも優れており、平均および最大エラーを少なくとも3分の2削減します。合成画像でトレーニングされたi3PosNetは、さらに適応することなく、実際のX線に一般化します。結論:ディープラーニングベースの方法を外科用アプリケーションに変換することは困難です。トレーニングとテスト用の大規模な代表的なデータセットが利用できないためです。この作業は、合成トレーニングデータのみに基づいてトレーニングされたサブミリメートルポーズの推定を経験的に示しています。
Purpose: Accurate estimation of the position and orientation (pose) of surgical instruments is crucial for delicate minimally invasive temporal bone surgery. Current techniques lack in accuracy and/or line-of-sight constraints (conventional tracking systems) or expose the patient to prohibitive ionizing radiation (intra-operative CT). A possible solution is to capture the instrument with a c-arm at irregular intervals and recover the pose from the image. Methods: i3PosNet infers the position and orientation of instruments from images using a pose estimation network. Said framework considers localized patches and outputs pseudo-landmarks. The pose is reconstructed from pseudo-landmarks by geometric considerations. Results: We show i3PosNet reaches errors less than 0.05mm. It outperforms conventional image registration-based approaches reducing average and maximum errors by at least two thirds. i3PosNet trained on synthetic images generalizes to real x-rays without any further adaptation. Conclusion: The translation of Deep Learning based methods to surgical applications is difficult, because large representative datasets for training and testing are not available. This work empirically shows sub-millimeter pose estimation trained solely based on synthetic training data.