arXiv reaDer
X線画像での金属セグメンテーションを可能にするビジョントランスフォーマーのシミュレーション駆動型トレーニング
Simulation-Driven Training of Vision Transformers Enabling Metal Segmentation in X-Ray Images
X線ラジオグラフィーのいくつかの画像取得および処理ステップでは、金属インプラントの存在とその正確な位置に関する知識が非常に有益です(たとえば、線量調整、画像コントラスト調整)。正確な金属セグメンテーションの恩恵を受ける別のアプリケーションは、2D X線投影に基づくコーンビームコンピュータ断層撮影(CBCT)です。金属の減衰が大きいため、3DX線の取得で深刻なアーチファクトが発生します。 CBCT投影での金属セグメンテーションは、通常、金属アーチファクトの回避および削減アルゴリズムの前提条件として機能します。高品質の臨床トレーニングの生成は常に課題であるため、この研究では、CTデータセットと自己設計のコンピューター支援設計(CAD)インプラントを組み合わせて、畳み込みニューラルネットワーク(CNN)を利用してシミュレートされたX線画像を生成することを提案します。金属セグメンテーション用のビジョントランスフォーマー(ViT)。モデルテストは、標本スキャンから取得された正確にラベル付けされたX線テストデータセットに対して実行されます。 U-NetのようなCNNエンコーダーベースのネットワークは、平均ダイススコアが0.30未満のcadaverテストデータでのパフォーマンスが制限されていますが、デュアルデコーダーを備えた金属セグメンテーショントランスフォーマー(MST-DD)は、セグメンテーションタスクで高い堅牢性と一般化を示しています。 0.90の平均ダイススコア。私たちの研究は、CADモデルベースのデータ生成には高い柔軟性があり、臨床データのサンプリングとラベリングの不足の問題を克服する方法である可能性があることを示しています。さらに、MST-DDアプローチは、シミュレーションデータのトレーニングの場合に、より信頼性の高いニューラルネットワークを生成します。
In several image acquisition and processing steps of X-ray radiography, knowledge of the existence of metal implants and their exact position is highly beneficial (e.g. dose regulation, image contrast adjustment). Another application which would benefit from an accurate metal segmentation is cone beam computed tomography (CBCT) which is based on 2D X-ray projections. Due to the high attenuation of metals, severe artifacts occur in the 3D X-ray acquisitions. The metal segmentation in CBCT projections usually serves as a prerequisite for metal artifact avoidance and reduction algorithms. Since the generation of high quality clinical training is a constant challenge, this study proposes to generate simulated X-ray images based on CT data sets combined with self-designed computer aided design (CAD) implants and make use of convolutional neural network (CNN) and vision transformer (ViT) for metal segmentation. Model test is performed on accurately labeled X-ray test datasets obtained from specimen scans. The CNN encoder-based network like U-Net has limited performance on cadaver test data with an average dice score below 0.30, while the metal segmentation transformer with dual decoder (MST-DD) shows high robustness and generalization on the segmentation task, with an average dice score of 0.90. Our study indicates that the CAD model-based data generation has high flexibility and could be a way to overcome the problem of shortage in clinical data sampling and labelling. Furthermore, the MST-DD approach generates a more reliable neural network in case of training on simulated data.
updated: Thu Mar 17 2022 09:58:58 GMT+0000 (UTC)
published: Thu Mar 17 2022 09:58:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト