arXiv reaDer
距離を意識したセルフアテンションによるディープマルチインスタンスラーニング
Deep Multiple Instance Learning with Distance-Aware Self-Attention
従来の教師あり学習タスクでは、トレーニング セット内のすべてのインスタンスにラベルが必要ですが、多くの現実世界のアプリケーションでは、ラベルはインスタンスのコレクション (バッグ) に対してのみ使用できます。マルチ インスタンス学習 (MIL) として知られるこの問題設定は、高解像度の画像が小さなパッチに分割されますが、ラベルが画像全体に適用される医療分野に特に関連します。最近の MIL モデルは、セルフ アテンションを採用することでパッチ間の対応関係を捉えることができ、バッグ内の他のすべてのパッチに基づいて各パッチを異なる重み付けすることができます。しかし、これらのアプローチは依然として、計算病理学において特に重要である、より大きな画像内のパッチ間の相対的な空間関係を考慮していません。この目的を達成するために、パッチ間の相互作用をモデル化する際に相対的な空間情報を明示的に考慮する距離認識セルフアテンション (DAS-MIL) を備えた新しい MIL モデルを導入します。離散的な自己注意のための既存の相対位置表現とは異なり、私たちのアプローチは、注意重みの計算に連続距離依存項を導入し、MIL のコンテキストで相対位置表現を適用する最初のアプローチです。相対的な空間情報の考慮が必要なカスタム MNIST ベースの MIL データセットと、公的に利用可能ながん転移検出データセットである CAMELYON16 でモデルを評価し、テスト AUROC スコア 0.91 を達成しました。どちらのデータセットでも、私たちのモデルは、絶対位置エンコーディングを採用する既存の MIL アプローチや、MIL に適用される既存の相対位置表現スキームよりも優れています。私たちのコードは https://anonymous.4open.science/r/das-mil で入手できます。
Traditional supervised learning tasks require a label for every instance in the training set, but in many real-world applications, labels are only available for collections (bags) of instances. This problem setting, known as multiple instance learning (MIL), is particularly relevant in the medical domain, where high-resolution images are split into smaller patches, but labels apply to the image as a whole. Recent MIL models are able to capture correspondences between patches by employing self-attention, allowing them to weigh each patch differently based on all other patches in the bag. However, these approaches still do not consider the relative spatial relationships between patches within the larger image, which is especially important in computational pathology. To this end, we introduce a novel MIL model with distance-aware self-attention (DAS-MIL), which explicitly takes into account relative spatial information when modelling the interactions between patches. Unlike existing relative position representations for self-attention which are discrete, our approach introduces continuous distance-dependent terms into the computation of the attention weights, and is the first to apply relative position representations in the context of MIL. We evaluate our model on a custom MNIST-based MIL dataset that requires the consideration of relative spatial information, as well as on CAMELYON16, a publicly available cancer metastasis detection dataset, where we achieve a test AUROC score of 0.91. On both datasets, our model outperforms existing MIL approaches that employ absolute positional encodings, as well as existing relative position representation schemes applied to MIL. Our code is available at https://anonymous.4open.science/r/das-mil.
updated: Sat May 20 2023 12:45:27 GMT+0000 (UTC)
published: Wed May 17 2023 20:11:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト