arXiv reaDer
マルチドメインデータ集約に基づく医療画像セグメンテーションのための階層的自己教師あり学習
Hierarchical Self-Supervised Learning for Medical Image Segmentation Based on Multi-Domain Data Aggregation
大きなラベル付きデータセットは、教師あり深層学習の成功の鍵ですが、医療画像のセグメンテーションでは、モデルトレーニングに十分な注釈付き画像を取得することは非常に困難です。多くのシナリオでは、注釈のない画像が豊富で、簡単に取得できます。自己教師あり学習(SSL)は、生データ情報と表現学習を活用する上で大きな可能性を示しています。本論文では、注釈なしデータを有効に活用することで医療画像のセグメンテーションを促進する新しい自己教師ありフレームワークである階層的自己教師あり学習(HSSL)を提案します。タスク固有の自己教師あり事前トレーニングとそれに続く教師あり微調整に関する現在の文献とは異なり、SSLを利用して、さまざまな医療画像セグメンテーションタスクの異種データからタスクにとらわれない知識を学習します。具体的には、最初にいくつかの医学的課題からのデータセットを集約し、次に自己監視方式でネットワークを事前トレーニングし、最後にラベル付きデータを微調整します。対照損失と分類損失を組み合わせて新しい損失関数を開発し、セグメンテーションタスク用のエンコーダ-デコーダアーキテクチャを事前トレーニングします。私たちの広範な実験は、マルチドメインジョイントプレトレーニングがダウンストリームセグメンテーションタスクに利益をもたらし、シングルドメインプレトレーニングよりも大幅に優れていることを示しています。ゼロから学習する場合と比較して、新しい方法では、さまざまなタスクでパフォーマンスが向上します(たとえば、注釈付きデータの5%を使用したDiceスコアで+ 0.69%から+ 18.60%)。限られた量のトレーニングデータで、私たちの方法は、より密度の高い注釈とのパフォーマンスギャップを実質的に埋めることができます(たとえば、注釈付きデータの10%対〜100%)。
A large labeled dataset is a key to the success of supervised deep learning, but for medical image segmentation, it is highly challenging to obtain sufficient annotated images for model training. In many scenarios, unannotated images are abundant and easy to acquire. Self-supervised learning (SSL) has shown great potentials in exploiting raw data information and representation learning. In this paper, we propose Hierarchical Self-Supervised Learning (HSSL), a new self-supervised framework that boosts medical image segmentation by making good use of unannotated data. Unlike the current literature on task-specific self-supervised pretraining followed by supervised fine-tuning, we utilize SSL to learn task-agnostic knowledge from heterogeneous data for various medical image segmentation tasks. Specifically, we first aggregate a dataset from several medical challenges, then pre-train the network in a self-supervised manner, and finally fine-tune on labeled data. We develop a new loss function by combining contrastive loss and classification loss and pretrain an encoder-decoder architecture for segmentation tasks. Our extensive experiments show that multi-domain joint pre-training benefits downstream segmentation tasks and outperforms single-domain pre-training significantly. Compared to learning from scratch, our new method yields better performance on various tasks (e.g., +0.69% to +18.60% in Dice scores with 5% of annotated data). With limited amounts of training data, our method can substantially bridge the performance gap w.r.t. denser annotations (e.g., 10% vs.~100% of annotated data).
updated: Sat Jul 10 2021 18:17:57 GMT+0000 (UTC)
published: Sat Jul 10 2021 18:17:57 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト