COVID-19 が世界中に蔓延する中、画像ベースの診断などの人間の労力を減らして病気の蔓延を遅らせるための、迅速かつ正確な自動トリアージ メカニズムの必要性が生じました。文献はこの方向への有望な取り組みを示していますが、報告された結果は、さまざまな状況下で取得された CT スキャンの変動性を考慮していないため、結果のモデルは、たとえばさまざまなスキャナー技術を使用して取得したデータで使用するのに適していません。現在、COVID-19 の診断は PCR 検査を使用して効率的に行うことができますが、このユース ケースは、医用画像解析モデルをより広く適用できるようにするために、データのばらつきの問題を克服する方法論の必要性を示しています。この論文では、COVID-19 診断の例を使用して変動性の問題に明示的に対処し、イメージング技術などによって引き起こされる違いを消去することを目的とした新しい生成的アプローチを提案すると同時に、ディープオートエンコーダー。提案された prepossessing アーキテクチャ (PrepNet) は、(i) 複数の CT スキャン データセットで共同でトレーニングされ、(ii) 改善された診断のために改善された識別機能を抽出できます。 3 つの公開データセット (SARS-COVID-2、UCSD COVID-CT、MosMed) での実験結果は、データセット内のパフォーマンスがわずかに低下したにもかかわらず、モデルがクロスデータセットの一般化を最大 11.84 パーセント ポイント改善することを示しています。
With the spread of COVID-19 over the world, the need arose for fast and precise automatic triage mechanisms to decelerate the spread of the disease by reducing human efforts e.g. for image-based diagnosis. Although the literature has shown promising efforts in this direction, reported results do not consider the variability of CT scans acquired under varying circumstances, thus rendering resulting models unfit for use on data acquired using e.g. different scanner technologies. While COVID-19 diagnosis can now be done efficiently using PCR tests, this use case exemplifies the need for a methodology to overcome data variability issues in order to make medical image analysis models more widely applicable. In this paper, we explicitly address the variability issue using the example of COVID-19 diagnosis and propose a novel generative approach that aims at erasing the differences induced by e.g. the imaging technology while simultaneously introducing minimal changes to the CT scans through leveraging the idea of deep auto-encoders. The proposed prepossessing architecture (PrepNet) (i) is jointly trained on multiple CT scan datasets and (ii) is capable of extracting improved discriminative features for improved diagnosis. Experimental results on three public datasets (SARS-COVID-2, UCSD COVID-CT, MosMed) show that our model improves cross-dataset generalization by up to 11.84 percentage points despite a minor drop in within dataset performance.