arXiv reaDer
ConTrack: X 線でのデバイス追跡のためのコンテキスト トランスフォーマー
ConTrack: Contextual Transformer for Device Tracking in X-ray
デバイスの追跡は、血管内処置中のガイダンスの重要な前提条件です。特に心臓インターベンション中、2D 透視画像におけるカテーテル先端の誘導の検出と追跡は、血管造影 (造影剤を使用した高線量) から透視検査 (造影剤を使用しない低線量) までの血管のマッピングなどのアプリケーションにとって重要です。カテーテルの先端を追跡することは、さまざまな課題を引き起こします。血管造影またはインターベンショナルデバイス中に、造影剤によって先端が閉塞される可能性があります。そして心臓と呼吸の動きによって常に動き続けています。これらの課題を克服するために、X 線透視検査と血管造影の両方で正確なデバイスの検出と追跡を行うために空間的および時間的なコンテキスト情報の両方を使用するトランスベースのネットワークである ConTrack を提案します。空間情報はテンプレート フレームとセグメンテーション モジュールから取得されます。テンプレート フレームはデバイスの周囲を定義しますが、セグメンテーション モジュールはデバイス全体を検出して、先端予測のためのより多くのコンテキストをもたらします。複数のテンプレートを使用すると、造影剤によってデバイスが閉塞されたときのデバイスの外観の変化に対してモデルがより堅牢になります。現在のフレームと前のフレームの間でセグメント化されたカテーテル マスク上で計算されたフロー情報は、呼吸と心臓の動きを補償することにより、予測をさらに精緻化するのに役立ちます。実験では、最先端の追跡モデルと比較して、私たちの方法が検出と追跡において 45% 以上の精度を達成していることが示されています。
Device tracking is an important prerequisite for guidance during endovascular procedures. Especially during cardiac interventions, detection and tracking of guiding the catheter tip in 2D fluoroscopic images is important for applications such as mapping vessels from angiography (high dose with contrast) to fluoroscopy (low dose without contrast). Tracking the catheter tip poses different challenges: the tip can be occluded by contrast during angiography or interventional devices; and it is always in continuous movement due to the cardiac and respiratory motions. To overcome these challenges, we propose ConTrack, a transformer-based network that uses both spatial and temporal contextual information for accurate device detection and tracking in both X-ray fluoroscopy and angiography. The spatial information comes from the template frames and the segmentation module: the template frames define the surroundings of the device, whereas the segmentation module detects the entire device to bring more context for the tip prediction. Using multiple templates makes the model more robust to the change in appearance of the device when it is occluded by the contrast agent. The flow information computed on the segmented catheter mask between the current and the previous frame helps in further refining the prediction by compensating for the respiratory and cardiac motions. The experiments show that our method achieves 45% or higher accuracy in detection and tracking when compared to state-of-the-art tracking models.
updated: Fri Jul 14 2023 14:20:09 GMT+0000 (UTC)
published: Fri Jul 14 2023 14:20:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト