arXiv reaDer
CMT: 低複雑性多段階注意メカニズムの融合による胸部 X 線画像からの迅速認識肺炎の解釈可能なモデル
CMT: Interpretable Model for Rapid Recognition Pneumonia from Chest X-Ray Images by Fusing Low Complexity Multilevel Attention Mechanism
胸部画像は、呼吸状態の悪化の証拠がある COVID-19 患者の診断と予測に重要な役割を果たします。コンピューター支援診断を可能にするために、肺炎のディープラーニングベースの診断モデルが数多く開発されています。ただし、長いトレーニングと推論時間により、柔軟性がなくなります。さらに、解釈可能性の欠如は、臨床医療における信頼性を低下させます。この論文では、肺炎、特にCOVID-19陽性の解釈可能性と迅速な認識を備えたモデルであるCMTを紹介します。最初に CMT の複数の畳み込み層を使用して CXR 画像の特徴を抽出し、次に Transformer を適用して各症状の可能性を計算します。モデルの汎化パフォーマンスを改善し、まばらな医用画像データの問題に対処するために、画像拡張のプラグアンドプレイ方式である Feature Fusion Augmentation (FFA) を提案します。 2 つの画像の特徴をさまざまな程度に融合して、元の分布から逸脱しない新しい画像を生成します。さらに、計算の複雑さを軽減し、収束を加速するために、マルチレベルのマルチヘッド自己注意 (MMSA) を提案します。トレーニングと推論の時間を大幅に短縮しながら、モデルのパフォーマンスを大幅に向上させます。最大の COVID-19 データセットに関する実験結果は、提案された CMT が最先端のパフォーマンスを備えていることを示しています。 FFA と MMSA の有効性は、アブレーション実験で実証されています。さらに、モデル推論プロセスの重みと機能活性化マップが視覚化され、CMT の解釈可能性が示されます。
Chest imaging plays an essential role in diagnosing and predicting patients with COVID-19 with evidence of worsening respiratory status. Many deep learning-based diagnostic models for pneumonia have been developed to enable computer-aided diagnosis. However, the long training and inference time make them inflexible. In addition, the lack of interpretability reduces their credibility in clinical medical practice. This paper presents CMT, a model with interpretability and rapid recognition of pneumonia, especially COVID-19 positive. Multiple convolutional layers in CMT are first used to extract features in CXR images, and then Transformer is applied to calculate the possibility of each symptom. To improve the model's generalization performance and to address the problem of sparse medical image data, we propose Feature Fusion Augmentation (FFA), a plug-and-play method for image augmentation. It fuses the features of the two images to varying degrees to produce a new image that does not deviate from the original distribution. Furthermore, to reduce the computational complexity and accelerate the convergence, we propose Multilevel Multi-Head Self-Attention (MMSA), which computes attention on different levels to establish the relationship between global and local features. It significantly improves the model performance while substantially reducing its training and inference time. Experimental results on the largest COVID-19 dataset show the proposed CMT has state-of-the-art performance. The effectiveness of FFA and MMSA is demonstrated in the ablation experiments. In addition, the weights and feature activation maps of the model inference process are visualized to show the CMT's interpretability.
updated: Sat Oct 29 2022 12:12:03 GMT+0000 (UTC)
published: Sat Oct 29 2022 12:12:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト