脊椎手術の計画では、介入で広く使用されている術中画像診断法であるコーンビームコンピュータ断層撮影(CBCT)で椎骨を自動的にセグメンテーションする必要があります。ただし、CBCT画像は、ノイズ、組織のコントラストの低下、金属物体の存在により、低品質でアーチファクトが多く、手動でも椎骨のセグメンテーションが困難な作業になります。対照的に、椎骨の注釈が付いたアーチファクトのない高品質のCT画像が豊富に存在します。これにより、注釈付きの対になっていないCT画像を使用してCBCT椎骨セグメンテーションモデルを構築するようになります。 CBCTとCTの間のドメインとアーティファクトのギャップを克服するには、椎骨のセグメンテーション、アーティファクトの削減、モダリティ変換の3つの異種タスクにすべて一緒に対処する必要があります。これに、学習を促進するためにこれらの3つのタスクの知識共有を集中的に活用する新しい解剖学を意識したアーティファクトの解きほぐしとセグメンテーションネットワーク(A ^ 3DSegNet)を提案します。具体的には、CBCTとCT画像のランダムなペアを入力として受け取り、解きほぐされた潜在層からのさまざまなデコードの組み合わせを介して合成とセグメンテーションを操作します。次に、合成された画像間およびセグメント化された椎骨間でさまざまな形式の一貫性を提案することにより、ペアの(つまり、解剖学的に同一の)データなしで学習が達成されます。最後に、2Dスライスを積み重ね、その上に3Dネットワークを構築して、最終的な3Dセグメンテーション結果を取得します。多数の臨床CBCT(21,364)およびCT(17,089)画像での広範な実験は、提案されたA ^ 3DSegNetが、タスクごとに個別にトレーニングされた最先端の競合方法よりも大幅に優れていることを示しています。対になっていない3DCBCT椎骨セグメンテーションの平均ダイス係数は0.926です。
Spinal surgery planning necessitates automatic segmentation of vertebrae in cone-beam computed tomography (CBCT), an intraoperative imaging modality that is widely used in intervention. However, CBCT images are of low-quality and artifact-laden due to noise, poor tissue contrast, and the presence of metallic objects, causing vertebra segmentation, even manually, a demanding task. In contrast, there exists a wealth of artifact-free, high quality CT images with vertebra annotations. This motivates us to build a CBCT vertebra segmentation model using unpaired CT images with annotations. To overcome the domain and artifact gaps between CBCT and CT, it is a must to address the three heterogeneous tasks of vertebra segmentation, artifact reduction and modality translation all together. To this, we propose a novel anatomy-aware artifact disentanglement and segmentation network (A^3DSegNet) that intensively leverages knowledge sharing of these three tasks to promote learning. Specifically, it takes a random pair of CBCT and CT images as the input and manipulates the synthesis and segmentation via different decoding combinations from the disentangled latent layers. Then, by proposing various forms of consistency among the synthesized images and among segmented vertebrae, the learning is achieved without paired (i.e., anatomically identical) data. Finally, we stack 2D slices together and build 3D networks on top to obtain final 3D segmentation result. Extensive experiments on a large number of clinical CBCT (21,364) and CT (17,089) images show that the proposed A^3DSegNet performs significantly better than state-of-the-art competing methods trained independently for each task and, remarkably, it achieves an average Dice coefficient of 0.926 for unpaired 3D CBCT vertebra segmentation.