Multi-scale self-guided attention for medical image segmentation
 畳み込みニューラルネットワーク(CNN)が医療画像のセグメンテーションの進歩を推進しているにもかかわらず、標準モデルにはまだいくつかの欠点があります。まず、マルチスケールアプローチ、つまりエンコーダーデコーダーアーキテクチャーを使用すると、同様の低レベルの特徴が複数のスケールで複数回抽出される情報の冗長な使用につながります。第二に、長距離フィーチャの依存関係は効率的にモデル化されないため、各セマンティッククラスに関連付けられた非最適な識別フィーチャ表現になります。このホワイトペーパーでは、ガイド付き自己注意メカニズムの使用に基づいてより豊富なコンテキスト依存関係をキャプチャすることにより、提案されたアーキテクチャでこれらの制限を克服しようとします。このアプローチは、ローカル機能を対応するグローバル依存性と統合し、相互依存チャネルマップを適応的に強調することができます。さらに、異なるモジュール間の追加の損失は、関連する特徴の関連付けを強調することにより、無関係な情報を無視し、画像のより識別的な領域に焦点を当てるように注意メカニズムを導きます。 3つの異なるデータセットのセマンティックセグメンテーションのコンテキストで提案モデルを評価します:腹部臓器、心血管構造、脳腫瘍。一連のアブレーション実験は、提案されたアーキテクチャにおけるこれらの注意モジュールの重要性をサポートしています。さらに、他の最先端のセグメンテーションネットワークと比較して、モデルのセグメンテーションパフォーマンスが向上し、標準偏差を減らしながら予測の精度が向上します。これは、医療画像の正確で信頼性の高い自動セグメンテーションを生成するためのアプローチの効率性を示しています。コードはで公開されています
Even though convolutional neural networks (CNNs) are driving progress in medical image segmentation, standard models still have some drawbacks. First, the use of multi-scale approaches, i.e., encoder-decoder architectures, leads to a redundant use of information, where similar low-level features are extracted multiple times at multiple scales. Second, long-range feature dependencies are not efficiently modeled, resulting in non-optimal discriminative feature representations associated with each semantic class. In this paper we attempt to overcome these limitations with the proposed architecture, by capturing richer contextual dependencies based on the use of guided self-attention mechanisms. This approach is able to integrate local features with their corresponding global dependencies, as well as highlight interdependent channel maps in an adaptive manner. Further, the additional loss between different modules guides the attention mechanisms to neglect irrelevant information and focus on more discriminant regions of the image by emphasizing relevant feature associations. We evaluate the proposed model in the context of semantic segmentation on three different datasets: abdominal organs, cardiovascular structures and brain tumors. A series of ablation experiments support the importance of these attention modules in the proposed architecture. In addition, compared to other state-of-the-art segmentation networks our model yields better segmentation performance, increasing the accuracy of the predictions while reducing the standard deviation. This demonstrates the efficiency of our approach to generate precise and reliable automatic segmentations of medical images. Our code is made publicly available at
updated: Fri Feb 14 2020 20:23:08 GMT+0000 (UTC)
published: Fri Jun 07 2019 00:54:05 GMT+0000 (UTC)
