arXiv reaDer
RFR-WWANet: 教師なし画像レジストレーションのための加重ウィンドウ アテンションベースの回復機能解決ネットワーク
RFR-WWANet: Weighted Window Attention-Based Recovery Feature Resolution Network for Unsupervised Image Registration
Swin トランスフォーマーは、その計算効率と長距離モデリング機能により、最近医療画像解析で注目を集めています。これらの特性により、Swin Transformer は、複雑な腹部画像位置合わせタスクにおいて、異なる位置にある対応するボクセル間のより離れた関係を確立するのに適しています。ただし、トランスフォーマーに基づく登録モデルは、複数のボクセルを 1 つのセマンティック トークンに結合します。このマージ プロセスにより、トランスフォーマーがモデル化して粗粒度の空間情報を生成するように制限されます。この問題に対処するために、私たちは、Recovery Feature Resolution Network (RFRNet) を提案します。これにより、トランスフォーマーは、より高い解像度レベルに対するきめ細かい空間情報と豊富なセマンティック対応を提供できるようになります。さらに、シフトされたウィンドウ分割操作は柔軟性が低く、不確実な距離にわたってセマンティック情報を認識できず、ウィンドウ間のグローバル接続を自動的にブリッジすることができないことを示しています。したがって、ウィンドウ間のグローバルな対話を自動的に構築するために、重み付けウィンドウ アテンション (WWA) を提案します。これは、Swin トランスフォーマ ブロック内の通常および循環シフト ウィンドウ分割操作の後に実装されます。 RFR-WWANet と名付けられた、提案された教師なし変形可能画像登録モデルは、長距離相関を検出し、解剖学的構造の意味のある意味的関連性を容易にします。定性的および定量的な結果は、RFR-WWANet が現在の最先端の方法に比べて大幅な改善を達成していることを示しています。アブレーション実験は、RFRNet と WWA 設計の有効性を実証します。私たちのコードは https://github.com/MingR-Ma/RFR-WWANet で入手できます。
The Swin transformer has recently attracted attention in medical image analysis due to its computational efficiency and long-range modeling capability. Owing to these properties, the Swin Transformer is suitable for establishing more distant relationships between corresponding voxels in different positions in complex abdominal image registration tasks. However, the registration models based on transformers combine multiple voxels into a single semantic token. This merging process limits the transformers to model and generate coarse-grained spatial information. To address this issue, we propose Recovery Feature Resolution Network (RFRNet), which allows the transformer to contribute fine-grained spatial information and rich semantic correspondences to higher resolution levels. Furthermore, shifted window partitioning operations are inflexible, indicating that they cannot perceive the semantic information over uncertain distances and automatically bridge the global connections between windows. Therefore, we present a Weighted Window Attention (WWA) to build global interactions between windows automatically. It is implemented after the regular and cyclic shift window partitioning operations within the Swin transformer block. The proposed unsupervised deformable image registration model, named RFR-WWANet, detects the long-range correlations, and facilitates meaningful semantic relevance of anatomical structures. Qualitative and quantitative results show that RFR-WWANet achieves significant improvements over the current state-of-the-art methods. Ablation experiments demonstrate the effectiveness of the RFRNet and WWA designs. Our code is available at https://github.com/MingR-Ma/RFR-WWANet.
updated: Mon May 22 2023 02:41:32 GMT+0000 (UTC)
published: Sun May 07 2023 09:57:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト