arXiv reaDer
画像から直接柔軟な手術器具のポーズ回帰のための運動学的ボトルネックアプローチ
A Kinematic Bottleneck Approach For Pose Regression of Flexible Surgical Instruments directly from Images
器具の3Dポーズ推定は、ロボットによる低侵襲手術の自動シーン理解に向けた重要なステップです。ロボットシステムは潜在的に直接ジョイント値を提供できますが、特に連続体ロボットの場合、信頼性が低く、アクセスが制限され、キャリブレーションに時間がかかるため、この情報は手術室で一般的に利用されません。このため、3Dポーズ推定の標準的なアプローチには、外部追跡システムの使用が含まれます。最近、画像ベースの方法が有望で非侵襲的な代替手段として浮上しています。文献の多くの画像ベースのアプローチは正確な結果を示していますが、一般に、処理された画像ごとに複雑な反復最適化が必要であり、リアルタイムアプリケーションには不適切であるか、効率的な学習のために手動で注釈が付けられた多数の画像が必要です。この論文では、ロボットによって提供される不正確な運動学的情報をトレーニング時にのみ利用する、自己監視画像ベースの方法を提案します。時間のかかる手動注釈の導入を回避するために、問題は自動エンコーダーとして定式化され、ロボット機器と手術用カメラの物理モデルの存在によってスマートにボトルネックになり、画像の背景と運動学的コンテンツを強制的に分離します。メソッドの検証は、柔軟なロボット化内視鏡を使用して取得された半合成、ファントム、および生体内のデータセットで実行され、手術器具のリアルタイム画像ベースの3Dポーズ推定の有望な結果を示しています。
3-D pose estimation of instruments is a crucial step towards automatic scene understanding in robotic minimally invasive surgery. Although robotic systems can potentially directly provide joint values, this information is not commonly exploited inside the operating room, due to its possible unreliability, limited access and the time-consuming calibration required, especially for continuum robots. For this reason, standard approaches for 3-D pose estimation involve the use of external tracking systems. Recently, image-based methods have emerged as promising, non-invasive alternatives. While many image-based approaches in the literature have shown accurate results, they generally require either a complex iterative optimization for each processed image, making them unsuitable for real-time applications, or a large number of manually-annotated images for efficient learning. In this paper we propose a self-supervised image-based method, exploiting, at training time only, the imprecise kinematic information provided by the robot. In order to avoid introducing time-consuming manual annotations, the problem is formulated as an auto-encoder, smartly bottlenecked by the presence of a physical model of the robotic instruments and surgical camera, forcing a separation between image background and kinematic content. Validation of the method was performed on semi-synthetic, phantom and in-vivo datasets, obtained using a flexible robotized endoscope, showing promising results for real-time image-based 3-D pose estimation of surgical instruments.
updated: Sun Feb 28 2021 18:41:18 GMT+0000 (UTC)
published: Sun Feb 28 2021 18:41:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト