病理学者の模倣: ギガピクセル組織画像のスコアリングのための二重注意モデル
Mimicking a Pathologist: Dual Attention Model for Scoring of Gigapixel Histology Images
スライド全体の画像 (WSI) の自動処理に関連するいくつかの主要な課題には、そのサイズ、さまざまな倍率レベル、および高解像度が含まれます。これらの画像を AI フレームワークで直接利用すると、メモリの制約により計算コストが高くなりますが、WSI をダウンサンプリングすると情報の損失が発生し、WSI をタイルとパッチに分割すると、重要なコンテキスト情報が失われます。病理学者による視覚検査を模倣するために、2 つの主要なコンポーネントからなる新しい二重注意アプローチを提案します。最初のコンポーネントは、さまざまな関心領域を決定するために WSI の高レベル ビューを入力として受け取るソフト アテンション モデルです。カスタム サンプリング方法を採用して、選択された注目度の高い領域から多様で空間的に異なる画像タイルを抽出します。 2 番目のコンポーネントはハード アテンション分類モデルで、分類のために各タイルからマルチ解像度の垣間見るシーケンスをさらに抽出します。ハードアテンションは微分不可能であるため、強化学習を使用してこのコンポーネントをトレーニングし、特定のタイルのすべてのパッチを処理せずに垣間見る場所を予測することで、病理学者の診断方法に合わせます。提案されたモデルの有効性を実証するために、関節損失関数を使用してコンポーネントを個別に、およびエンドツーエンドの方法でトレーニングします。提案したモデルを 2 つの異なる IHC ユース ケースで使用します。乳がんの HER2 予測と、結腸直腸がんの 2 つの MMR バイオマーカーのインタクト/ロス状態の予測です。提案されたモデルは、最高倍率で WSI のごく一部のみを処理しながら、最先端の方法に匹敵する精度を達成することを示します。
Some major challenges associated with the automated processing of whole slide images (WSIs) includes their sheer size, different magnification levels and high resolution. Utilizing these images directly in AI frameworks is computationally expensive due to memory constraints, while downsampling WSIs incurs information loss and splitting WSIs into tiles and patches results in loss of important contextual information. We propose a novel dual attention approach, consisting of two main components, to mimic visual examination by a pathologist. The first component is a soft attention model which takes as input a high-level view of the WSI to determine various regions of interest. We employ a custom sampling method to extract diverse and spatially distinct image tiles from selected high attention areas. The second component is a hard attention classification model, which further extracts a sequence of multi-resolution glimpses from each tile for classification. Since hard attention is non-differentiable, we train this component using reinforcement learning and predict the location of glimpses without processing all patches of a given tile, thereby aligning with pathologist's way of diagnosis. We train our components both separately and in an end-to-end fashion using a joint loss function to demonstrate the efficacy of our proposed model. We employ our proposed model on two different IHC use cases: HER2 prediction on breast cancer and prediction of Intact/Loss status of two MMR biomarkers, for colorectal cancer. We show that the proposed model achieves accuracy comparable to state-of-the-art methods while only processing a small fraction of the WSI at highest magnification.
updated: Sun Feb 19 2023 22:26:25 GMT+0000 (UTC)
published: Sun Feb 19 2023 22:26:25 GMT+0000 (UTC)
