arXiv reaDer
生存予測のためのグローバル構造一貫性を備えたマルチモーダル最適輸送ベースの同時注意トランスフォーマー
Multimodal Optimal Transport-based Co-Attention Transformer with Global Structure Consistency for Survival Prediction
生存予測は、死亡リスクのランキングを予測することを目的とした複雑な順序回帰タスクであり、一般に組織学データとゲノムデータの統合から恩恵を受けます。病理学とゲノミクスからの共同学習が進歩しているにもかかわらず、既存の方法は依然として次のような困難な問題に悩まされています。 1) 病理学画像のサイズが大きいため、ギガピクセルの全スライド画像 (WSI) を効果的に表現することが困難です。 2) 組織学における腫瘍微小環境 (TME) 内の相​​互作用は、生存率分析に不可欠です。現在のアプローチは、組織学データとゲノムデータ間の同時注目を介してこれらの相互作用をモデル化しようと試みていますが、モダリティ間の密な局所的類似性にのみ焦点を当てており、潜在的な構造間の全体的な一貫性、つまり、TME関連の組織学相互作用とゲノムデータの共発現を捉えることができません。ゲノムデータ。これらの課題に対処するために、我々は、グローバル構造の一貫性を備えたマルチモーダル最適トランスポートベースのコ・アテンション・トランスフォーマーフレームワークを提案します。このフレームワークでは、ギガピクセルWSIを表す情報パッチを選択するためのWSIのパッチと遺伝子埋め込みを一致させるために最適トランスポート(OT)が適用されます。 。さらに重要なことは、OT ベースの同時注意は、生存予測のために TME 内の構造的相互作用を効果的に捕捉するための全体的な認識を提供することです。 OT の高い計算複雑性を克服するために、アンバランスなミニバッチ OT で元の OT を近似することにより、WSI パッチのマイクロバッチに対する堅牢で効率的な実装を提案します。広範な実験により、最先端の方法と比較して、5 つのベンチマーク データセットにおける私たちの方法の優位性が示されています。コードが公開されています。
Survival prediction is a complicated ordinal regression task that aims to predict the ranking risk of death, which generally benefits from the integration of histology and genomic data. Despite the progress in joint learning from pathology and genomics, existing methods still suffer from challenging issues: 1) Due to the large size of pathological images, it is difficult to effectively represent the gigapixel whole slide images (WSIs). 2) Interactions within tumor microenvironment (TME) in histology are essential for survival analysis. Although current approaches attempt to model these interactions via co-attention between histology and genomic data, they focus on only dense local similarity across modalities, which fails to capture global consistency between potential structures, i.e. TME-related interactions of histology and co-expression of genomic data. To address these challenges, we propose a Multimodal Optimal Transport-based Co-Attention Transformer framework with global structure consistency, in which optimal transport (OT) is applied to match patches of a WSI and genes embeddings for selecting informative patches to represent the gigapixel WSI. More importantly, OT-based co-attention provides a global awareness to effectively capture structural interactions within TME for survival prediction. To overcome high computational complexity of OT, we propose a robust and efficient implementation over micro-batch of WSI patches by approximating the original OT with unbalanced mini-batch OT. Extensive experiments show the superiority of our method on five benchmark datasets compared to the state-of-the-art methods. The code is released.
updated: Wed Jun 14 2023 08:01:24 GMT+0000 (UTC)
published: Wed Jun 14 2023 08:01:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト