arXiv reaDer
誘導バイアスマルチヘッド自己注意を備えた3Dスウィントランスフォーマーに基づく肝血管セグメンテーション
Hepatic vessel segmentation based on 3D swin-transformer with inductive biased multi-head self-attention
目的:CT画像からの肝臓血管のセグメンテーションは、外科的計画の前に不可欠であり、医療画像分析コミュニティで幅広い関心を呼び起こしました。複雑な構造と低コントラストのバックグラウンドのため、自動肝血管セグメンテーションは特に困難なままです。関連する研究のほとんどは、バックボーンとしてFCN、U-net、およびV-netのバリアントを採用しています。ただし、これらの方法は主に、畳み込み演算子の限られた局所性受信フィールドのために誤分類されたボクセルを生成する可能性のあるマルチスケールの局所的特徴のキャプチャに焦点を合わせています。方法:スウィントランスフォーマーを3Dに拡張し、畳み込みと自己注意の効果的な組み合わせを採用することにより、誘導バイアスマルチヘッドアテンションベッセルネット(IBIMHAV-Net)と呼ばれる堅牢なエンドツーエンドのベッセルセグメンテーションネットワークを提案します。実際には、パッチ単位の埋め込みではなくボクセル単位の埋め込みを導入して正確な肝血管ボクセルを特定し、マルチスケール畳み込み演算子を採用して局所的な空間情報を取得します。一方、初期化された絶対位置埋め込みから帰納的バイアス相対位置埋め込みを学習する帰納的バイアスマルチヘッド自己注意を提案します。これに基づいて、より信頼性の高いクエリとキーマトリックスを取得できます。モデルの一般化を検証するために、構造の複雑さが異なるサンプルでテストします。結果:3DIRCADbデータセットで実験を行いました。テストされた4つのケースの平均ダイスと感度は74.8%と77.5%であり、既存の深層学習方法と改善されたグラフカット方法の結果を上回っています。結論:提案されたモデルIBIMHAV-Netは、CTボリュームのグローバルおよびローカル空間機能の両方をより有効に活用するインターリーブアーキテクチャを備えた、自動で正確な3D肝血管セグメンテーションを提供します。それは他の臨床データのためにさらに拡張することができます。
Purpose: Segmentation of liver vessels from CT images is indispensable prior to surgical planning and aroused broad range of interests in the medical image analysis community. Due to the complex structure and low contrast background, automatic liver vessel segmentation remains particularly challenging. Most of the related researches adopt FCN, U-net, and V-net variants as a backbone. However, these methods mainly focus on capturing multi-scale local features which may produce misclassified voxels due to the convolutional operator's limited locality reception field. Methods: We propose a robust end-to-end vessel segmentation network called Inductive BIased Multi-Head Attention Vessel Net(IBIMHAV-Net) by expanding swin transformer to 3D and employing an effective combination of convolution and self-attention. In practice, we introduce the voxel-wise embedding rather than patch-wise embedding to locate precise liver vessel voxels, and adopt multi-scale convolutional operators to gain local spatial information. On the other hand, we propose the inductive biased multi-head self-attention which learns inductive biased relative positional embedding from initialized absolute position embedding. Based on this, we can gain a more reliable query and key matrix. To validate the generalization of our model, we test on samples which have different structural complexity. Results: We conducted experiments on the 3DIRCADb datasets. The average dice and sensitivity of the four tested cases were 74.8% and 77.5%, which exceed results of existing deep learning methods and improved graph cuts method. Conclusion: The proposed model IBIMHAV-Net provides an automatic, accurate 3D liver vessel segmentation with an interleaved architecture that better utilizes both global and local spatial features in CT volumes. It can be further extended for other clinical data.
updated: Mon Nov 22 2021 02:02:41 GMT+0000 (UTC)
published: Fri Nov 05 2021 10:17:08 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト