追跡と三角測量のためのポイントオブインタレストネットワーク(POINT ^ 2)を介した介入のためのマルチビュー2D / 3Dリジッドレジストレーションの問題に取り組むことを提案します。 POINT ^ 2は、ランダムなPOIのセットを追跡することにより、介入前と介入内の画像間の2Dポイントツーポイント対応を確立することを学習します。次に、介入前のボリュームの3Dポーズが、三角測量レイヤーを介して推定されます。 POINT ^ 2では、POIトラッカーと三角測量レイヤーの統合されたフレームワークにより、有益な2D機能を学習し、3Dポーズを共同で推定できます。既存のアプローチとは対照的に、POINT ^ 2は、信頼性の高い2D / 3D登録を実現するために、1回のフォワードパスのみを必要とします。 POIトラッカーはシフト不変であるため、POINT ^ 2は3D介入前画像の初期ポーズに対してより堅牢です。大規模な臨床コーンビームCT(CBCT)データセットでの広範な実験は、提案されたPOINT ^ 2メソッドが、精度、堅牢性、および実行時間の点で既存の学習ベースのメソッドよりも優れていることを示しています。さらに、初期ポーズ推定器として使用すると、私たちの方法は、最先端の最適化ベースのアプローチの堅牢性と速度も10倍向上します。
We propose to tackle the problem of multiview 2D/3D rigid registration for intervention via a Point-Of-Interest Network for Tracking and Triangulation (POINT^2). POINT^2 learns to establish 2D point-to-point correspondences between the pre- and intra-intervention images by tracking a set of random POIs. The 3D pose of the pre-intervention volume is then estimated through a triangulation layer. In POINT^2, the unified framework of the POI tracker and the triangulation layer enables learning informative 2D features and estimating 3D pose jointly. In contrast to existing approaches, POINT^2 only requires a single forward-pass to achieve a reliable 2D/3D registration. As the POI tracker is shift-invariant, POINT^2 is more robust to the initial pose of the 3D pre-intervention image. Extensive experiments on a large-scale clinical cone-beam CT (CBCT) dataset show that the proposed POINT^2 method outperforms the existing learning-based method in terms of accuracy, robustness and running time. Furthermore, when used as an initial pose estimator, our method also improves the robustness and speed of the state-of-the-art optimization-based approaches by ten folds.