arXiv reaDer
エンコーダー以上のもの:アップサンプルへのTransformerデコーダーの紹介
More than Encoder: Introducing Transformer Decoder to Upsample
一般的なセグメンテーションモデルは、画像をダウンサンプリングしてからアップサンプリングし、ピクセルレベルの予測の解像度を復元します。このようなスキーマでは、パフォーマンスを向上させるために情報を維持するために、アップサンプル手法が不可欠です。このホワイトペーパーでは、新しいアップサンプルアプローチであるAttention Upsample(AU)を紹介します。これは、一般的なアップサンプルメソッドとして機能し、横方向の接続を持つ任意のセグメンテーションモデルに組み込むことができます。 AUは、ピクセルレベルの注意を活用して、長距離の依存関係とグローバル情報をモデル化し、再構築を改善します。これは、アテンションデコーダー(AD)と、アップサンプリングされた機能を補完する残余接続としてのバイリニアアップサンプルで構成されます。 ADは、契約パスからのローカルおよび詳細情報を条件とする機能をアップサンプリングするトランスフォーマーからのデコーダーのアイデアを採用しています。さらに、ピクセルレベルの注意の大規模なメモリと計算コストを考慮して、グローバル範囲ではなくローカルウィンドウでの注意計算を制限するためにウィンドウ注意スキームを使用することをさらに提案します。ウィンドウアテンションを組み込んで、デコーダーをウィンドウアテンションデコーダー(WAD)と呼び、アップサンプルメソッドをウィンドウアテンションアップサンプル(WAU)と呼びます。収縮経路から情報を配信し、Synapse(80.30DSCおよび23.12HD)およびMSD Brain(74.75 DSC)データセットで最先端のパフォーマンスを実現するために、横方向接続を備えた従来のU-Net構造でメソッドをテストします。
General segmentation models downsample images and then upsample to restore resolution for pixel level prediction. In such schema, upsample technique is vital in maintaining information for better performance. In this paper, we present a new upsample approach, Attention Upsample (AU), that could serve as general upsample method and be incorporated into any segmentation model that possesses lateral connections. AU leverages pixel-level attention to model long range dependency and global information for better reconstruction. It consists of Attention Decoder (AD) and bilinear upsample as residual connection to complement the upsampled features. AD adopts the idea of decoder from transformer which upsamples features conditioned on local and detailed information from contracting path. Moreover, considering the extensive memory and computation cost of pixel-level attention, we further propose to use window attention scheme to restrict attention computation in local windows instead of global range. Incorporating window attention, we denote our decoder as Window Attention Decoder (WAD) and our upsample method as Window Attention Upsample (WAU). We test our method on classic U-Net structure with lateral connection to deliver information from contracting path and achieve state-of-the-arts performance on Synapse (80.30 DSC and 23.12 HD) and MSD Brain (74.75 DSC) datasets.
updated: Sun Jun 20 2021 06:58:58 GMT+0000 (UTC)
published: Sun Jun 20 2021 06:58:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト