arXiv reaDer
トレーニングプール内の不確実性の減少:医療画像セグメンテーションのためのアクティブラーニング
Diminishing Uncertainty within the Training Pool: Active Learning for Medical Image Segmentation
アクティブラーニングは、機械学習手法の独自の抽象化であり、パッシブ機械学習とは異なり、モデル/アルゴリズムが、モデルに有益な一連のデータポイントの注釈についてユーザーをガイドできます。主な利点は、アクティブラーニングフレームワークが、ランダムに取得されたデータセットでトレーニングされたモデルと比較して、モデルの学習プロセスを加速し、完全な精度を達成するために必要なデータの量を減らすことができるデータポイントを選択することです。ディープラーニングと組み合わせたアクティブラーニングの複数のフレームワークが提案されており、それらの大部分は分類タスク専用です。ここでは、医用画像データセットのセグメンテーションのタスクのためのアクティブラーニングを探ります。 2つのデータセットを使用して、提案されたフレームワークを調査します。1。)海馬のMRIスキャン、2。)膵臓と腫瘍のCTスキャン。この作品は、共同オプティマイザーが委員会に使用されるアクティブラーニングのための委員会ごとのクエリアプローチを提示します。同時に、アクティブラーニングのための3つの新しい戦略を提案します。1。)トレーニングデータセットにバイアスをかけるために不確実なデータの頻度を増やす。 2.)トレーニングデータセットの多様性を確保するための取得の正則化として、入力画像間の相互情報量を使用します。 3.)スタイン変分勾配降下法(SVGD)に対するダイス対数尤度の適応。結果は、各データセットで利用可能なデータのそれぞれ22.69%と48.85%のみを使用しながら、完全な精度を達成することにより、データ削減の点で改善を示しています。
Active learning is a unique abstraction of machine learning techniques where the model/algorithm could guide users for annotation of a set of data points that would be beneficial to the model, unlike passive machine learning. The primary advantage being that active learning frameworks select data points that can accelerate the learning process of a model and can reduce the amount of data needed to achieve full accuracy as compared to a model trained on a randomly acquired data set. Multiple frameworks for active learning combined with deep learning have been proposed, and the majority of them are dedicated to classification tasks. Herein, we explore active learning for the task of segmentation of medical imaging data sets. We investigate our proposed framework using two datasets: 1.) MRI scans of the hippocampus, 2.) CT scans of pancreas and tumors. This work presents a query-by-committee approach for active learning where a joint optimizer is used for the committee. At the same time, we propose three new strategies for active learning: 1.) increasing frequency of uncertain data to bias the training data set; 2.) Using mutual information among the input images as a regularizer for acquisition to ensure diversity in the training dataset; 3.) adaptation of Dice log-likelihood for Stein variational gradient descent (SVGD). The results indicate an improvement in terms of data reduction by achieving full accuracy while only using 22.69 % and 48.85 % of the available data for each dataset, respectively.
updated: Thu Jan 07 2021 01:55:48 GMT+0000 (UTC)
published: Thu Jan 07 2021 01:55:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト