次にどのボリュームに注釈を付けるかは、ディープ ラーニング用の医用画像データセットを構築する際の困難な問題です。この問題にアプローチするための有望な方法の 1 つは、アクティブ ラーニング (AL) です。ただし、AL は、どの AL アルゴリズムと取得関数がどのデータセットに最も役立つかという点でクラックするのが難しいものでした。また、開始するラベル付きデータがゼロの場合、どのボリュームを最初にラベル付けするかで問題が悪化します。これは、AL のコールド スタート問題として知られています。 3D 画像セグメンテーションに特化した AL の 2 つの新しい戦略を提案します。まず、プロキシ タスクを提案し、プロキシ タスクから生成された不確実性を利用して、ラベル付けされていないデータを注釈付けすることで、コールド スタートの問題に取り組みます。次に、アクティブな反復ごとに 2 段階の学習フレームワークを作成します。このフレームワークでは、半教師付き微調整戦略として、ラベル付けされていないデータも第 2 段階で使用されます。医療セグメンテーション十種競技からの 2 つのよく知られた大規模な公開データセットに対するアプローチの有望性を示します。結果は、データの初期選択と半教師付きフレームワークの両方が、いくつかの AL 戦略で大幅な改善を示したことを示しています。
Which volume to annotate next is a challenging problem in building medical imaging datasets for deep learning. One of the promising methods to approach this question is active learning (AL). However, AL has been a hard nut to crack in terms of which AL algorithm and acquisition functions are most useful for which datasets. Also, the problem is exacerbated with which volumes to label first when there is zero labeled data to start with. This is known as the cold start problem in AL. We propose two novel strategies for AL specifically for 3D image segmentation. First, we tackle the cold start problem by proposing a proxy task and then utilizing uncertainty generated from the proxy task to rank the unlabeled data to be annotated. Second, we craft a two-stage learning framework for each active iteration where the unlabeled data is also used in the second stage as a semi-supervised fine-tuning strategy. We show the promise of our approach on two well-known large public datasets from medical segmentation decathlon. The results indicate that the initial selection of data and semi-supervised framework both showed significant improvement for several AL strategies.