COVID-19のパンデミックは数百万の症例と死亡を引き起こし、AI関連の科学界は、医用画像でのCOVID-19の兆候の検出に関与した後、現在、病気。このタスクはその性質上マルチモーダルであり、最近、公開されているAIforCOVIDデータセットで達成されたベースライン結果は、胸部X線スキャンと臨床情報が重篤な転帰のリスクがある患者を特定するのに役立つことを示しています。ディープラーニングはいくつかの医療分野で優れたパフォーマンスを示していますが、ほとんどの場合、単峰性のデータのみを考慮しています。この点で、さまざまなモダリティをいつ、どのように、どのように融合するかは、マルチモーダルディープラーニングにおける未解決の課題です。ここでこれらの3つの質問に対処するために、マルチモーダルエンドツーエンドモデルのセットアップを最適化する新しいアプローチを紹介します。これは、パレート多目的最適化を活用して、融合される複数の候補ユニモーダルニューラルネットワークのパフォーマンスメトリックとダイバーシティスコアを処理します。 AIforCOVIDデータセットでメソッドをテストし、ベースラインパフォーマンスを上回るだけでなく、外部検証に対しても堅牢な最先端の結果を達成します。さらに、XAIアルゴリズムを利用して、モダリティ間の階層を把握し、機能のモダリティ内の重要性を抽出して、モデルによって行われた予測に対する信頼を高めます。
The COVID-19 pandemic has caused millions of cases and deaths and the AI-related scientific community, after being involved with detecting COVID-19 signs in medical images, has been now directing the efforts towards the development of methods that can predict the progression of the disease. This task is multimodal by its very nature and, recently, baseline results achieved on the publicly available AIforCOVID dataset have shown that chest X-ray scans and clinical information are useful to identify patients at risk of severe outcomes. While deep learning has shown superior performance in several medical fields, in most of the cases it considers unimodal data only. In this respect, when, which and how to fuse the different modalities is an open challenge in multimodal deep learning. To cope with these three questions here we present a novel approach optimizing the setup of a multimodal end-to-end model. It exploits Pareto multi-objective optimization working with a performance metric and the diversity score of multiple candidate unimodal neural networks to be fused. We test our method on the AIforCOVID dataset, attaining state-of-the-art results, not only outperforming the baseline performance but also being robust to external validation. Moreover, exploiting XAI algorithms we figure out a hierarchy among the modalities and we extract the features' intra-modality importance, enriching the trust on the predictions made by the model.