arXiv reaDer
エンコーダー以上のもの: アップサンプルへの Transformer Decoder の導入
More than Encoder: Introducing Transformer Decoder to Upsample
医用画像のセグメンテーション方法は、特徴抽出のために画像をダウンサンプリングしてから、それらをアップサンプリングしてピクセルレベルの予測の解像度を復元します。このようなスキーマでは、情報を復元してパフォーマンスを向上させるために、アップサンプル手法が不可欠です。ただし、既存のアップサンプル技術は、ダウンサンプリング パスからの情報をほとんど活用しません。境界や組織テクスチャなどの浅い層からの局所的で詳細な特徴は、自然な画像のセグメンテーションと比較して、医療のセグメンテーションでは特に重要です。この目的のために、トランスフォーマーのアテンションデコーダーを導入することにより、ローカルウィンドウのダウンサンプリングパスからローカルおよび詳細な機能に条件付けられた機能をアップサンプリングする、医用画像セグメンテーションの新しいアップサンプルアプローチであるウィンドウアテンションアップサンプル (WAU) を提案します。 WAU は、一般的なアップサンプル手法として機能し、横方向の接続を持つ任意のセグメンテーション モデルに組み込むことができます。最初に、Attention Decoder (AD) とバイリニア アップサンプルで構成される Attention Upsample を提案します。 AD は、ピクセルレベルの注意を活用して、長期的な依存関係とグローバル情報をモデル化し、より良いアップサンプルを実現します。バイリニア アップサンプルは、アップサンプリングされた機能を補完する残差接続として導入されます。さらに、ピクセルレベルの注意の膨大なメモリと計算コストを考慮して、グローバル範囲ではなくローカルウィンドウで注意計算を制限するウィンドウ注意スキームをさらに設計します。横方向の接続を持つ従来の U-Net 構造でメソッド (WAU) を評価し、Synapse 多臓器セグメンテーション、Medical Segmentation Decathlon (MSD) Brain、および Automatic Cardiac Diagnosis Challenge (ACDC) データセットで最先端のパフォーマンスを達成します。 .また、複数のクラシック アーキテクチャでの手法の有効性を検証し、一貫した改善を実現します。
Medical image segmentation methods downsample images for feature extraction and then upsample them to restore resolution for pixel-level predictions. In such a schema, upsample technique is vital in restoring information for better performance. However, existing upsample techniques leverage little information from downsampling paths. The local and detailed feature from the shallower layer such as boundary and tissue texture is particularly more important in medical segmentation compared with natural image segmentation. To this end, we propose a novel upsample approach for medical image segmentation, Window Attention Upsample (WAU), which upsamples features conditioned on local and detailed features from downsampling path in local windows by introducing attention decoders of Transformer. WAU could serve as a general upsample method and be incorporated into any segmentation model that possesses lateral connections. We first propose the Attention Upsample which consists of Attention Decoder (AD) and bilinear upsample. AD leverages pixel-level attention to model long-range dependency and global information for a better upsample. Bilinear upsample is introduced as the residual connection to complement the upsampled features. Moreover, considering the extensive memory and computation cost of pixel-level attention, we further design a window attention scheme to restrict attention computation in local windows instead of the global range. We evaluate our method (WAU) on classic U-Net structure with lateral connections and achieve state-of-the-art performance on Synapse multi-organ segmentation, Medical Segmentation Decathlon (MSD) Brain, and Automatic Cardiac Diagnosis Challenge (ACDC) datasets. We also validate the effectiveness of our method on multiple classic architectures and achieve consistent improvement.
updated: Thu Nov 24 2022 08:05:25 GMT+0000 (UTC)
published: Sun Jun 20 2021 06:58:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト