COVID-19は感染率の高いウイルスであり、感染した患者を迅速に特定して病気の蔓延を抑える必要があります。現在のゴールドスタンダードテストである逆転写ポリメラーゼ連鎖反応(RT-PCR)では、偽陰性の割合が高くなっています。より正確な代替手段としてCTスキャン画像から診断することには、COVID-19を他の肺炎疾患と区別するという課題があります。人工知能は、放射線科医や医師が診断プロセスを加速し、その精度を高め、病気の重症度を測定するのに役立ちます。健康な人、COVID-19の患者、その他の肺炎の患者を軸方向の肺CTスキャン画像から区別するために、新しい解釈可能なディープニューラルネットワークを設計しました。私たちのモデルはまた、感染領域を検出し、感染した肺気量のパーセンテージを計算します。最初に画像を前処理してさまざまなデバイスのバッチ効果を排除し、次に弱く監視された方法を採用して、感染したパーツのタグを付けずにモデルをトレーニングしました。 6つの異なる医療センターからの3359サンプルの大規模なデータセットでモデルをトレーニングおよび評価しました。モデルは、健康な人を病気の人から、COVID-19を他の病気から分離する際に、それぞれ97.75%と98.15%の感度と87%と81.03%の特異性に達しました。また、6つの異なる医療センターからの1435サンプルで同様のパフォーマンスを示し、その一般化可能性を証明しています。多種多様なデータセットでのモデルのパフォーマンス、その一般化可能性、および解釈可能性により、信頼性の高い診断システムとして使用するのに適しています。
COVID-19 is a virus with high transmission rate that demands rapid identification of the infected patients to reduce the spread of the disease. The current gold-standard test, Reverse-Transcription Polymerase Chain Reaction (RT-PCR), has a high rate of false negatives. Diagnosing from CT-scan images as a more accurate alternative has the challenge of distinguishing COVID-19 from other pneumonia diseases. Artificial intelligence can help radiologists and physicians to accelerate the process of diagnosis, increase its accuracy, and measure the severity of the disease. We designed a new interpretable deep neural network to distinguish healthy people, patients with COVID-19, and patients with other pneumonia diseases from axial lung CT-scan images. Our model also detects the infected areas and calculates the percentage of the infected lung volume. We first preprocessed the images to eliminate the batch effects of different devices, and then adopted a weakly supervised method to train the model without having any tags for the infected parts. We trained and evaluated the model on a large dataset of 3359 samples from 6 different medical centers. The model reached sensitivities of 97.75% and 98.15%, and specificities of 87% and 81.03% in separating healthy people from the diseased and COVID-19 from other diseases, respectively. It also demonstrated similar performance for 1435 samples from 6 different medical centers which proves its generalizability. The performance of the model on a large diverse dataset, its generalizability, and interpretability makes it suitable to be used as a reliable diagnostic system.