arXiv reaDer
CTにおける普遍的な病変検出のための異種および部分的ラベルを備えた複数のデータセットからの学習
Learning from Multiple Datasets with Heterogeneous and Partial Labels for Universal Lesion Detection in CT
正確な深層学習モデルをトレーニングするには、高品質のラベルが付いた大規模なデータセットが必要です。ただし、注釈のコストが原因で、医用画像のデータセットは部分的にラベル付けされているか、小さいことがよくあります。たとえば、DeepLesionは、さまざまなタイプの病変を含むこのような大規模なCT画像データセットですが、ラベルのない病変(注釈がない)も多数あります。部分的にラベル付けされたデータセットで病変検出器をトレーニングする場合、注釈が欠落していると、誤った負の信号が生成され、パフォーマンスが低下します。 DeepLesionの他に、肺結節用のLUNAや肝腫瘍用のLiTSなど、いくつかの小さな単一タイプのデータセットがあります。これらのデータセットには異種のラベルスコープがあります。つまり、異なる病変タイプは異なるデータセットでラベル付けされ、他のタイプは無視されます。この作業では、さまざまな病変を検出するためのユニバーサル病変検出アルゴリズムの開発を目指しています。異種ラベルと部分ラベルの問題に取り組んでいます。まず、Lesion ENSemble(LENS)という名前のシンプルで効果的な病変検出フレームワークを構築します。 LENSは、複数の異種病変データセットからマルチタスク方式で効率的に学習し、提案の融合によってそれらの相乗効果を活用できます。次に、臨床の事前知識とデータセット間の知識の伝達を活用することにより、部分的にラベル付けされたデータセットから欠落している注釈をマイニングする戦略を提案します。最後に、4つの公共病変データセットでフレームワークをトレーニングし、DeepLesionの手動でラベル付けされた800のサブボリュームで評価します。私たちの方法は、平均感度の測定基準において、現在の最先端のアプローチと比較して49%の相対的な改善をもたらします。 DeepLesionの手動3Dアノテーションをhttps://github.com/viggin/DeepLesion_manual_test_setで公開しました。
Large-scale datasets with high-quality labels are desired for training accurate deep learning models. However, due to the annotation cost, datasets in medical imaging are often either partially-labeled or small. For example, DeepLesion is such a large-scale CT image dataset with lesions of various types, but it also has many unlabeled lesions (missing annotations). When training a lesion detector on a partially-labeled dataset, the missing annotations will generate incorrect negative signals and degrade the performance. Besides DeepLesion, there are several small single-type datasets, such as LUNA for lung nodules and LiTS for liver tumors. These datasets have heterogeneous label scopes, i.e., different lesion types are labeled in different datasets with other types ignored. In this work, we aim to develop a universal lesion detection algorithm to detect a variety of lesions. The problem of heterogeneous and partial labels is tackled. First, we build a simple yet effective lesion detection framework named Lesion ENSemble (LENS). LENS can efficiently learn from multiple heterogeneous lesion datasets in a multi-task fashion and leverage their synergy by proposal fusion. Next, we propose strategies to mine missing annotations from partially-labeled datasets by exploiting clinical prior knowledge and cross-dataset knowledge transfer. Finally, we train our framework on four public lesion datasets and evaluate it on 800 manually-labeled sub-volumes in DeepLesion. Our method brings a relative improvement of 49% compared to the current state-of-the-art approach in the metric of average sensitivity. We have publicly released our manual 3D annotations of DeepLesion in https://github.com/viggin/DeepLesion_manual_test_set.
updated: Sun Jan 03 2021 18:55:59 GMT+0000 (UTC)
published: Sat Sep 05 2020 17:55:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト