arXiv reaDer
ReMix:スライド全体の画像分類に基づくマルチインスタンス学習のための一般的で効率的なフレームワーク
ReMix: A General and Efficient Framework for Multiple Instance Learning based Whole Slide Image Classification
スライド全体の画像(WSI)の分類は、ギガピクセルの解像度の画像とスライドレベルのラベルを処理するために、弱く監視された複数インスタンス学習(MIL)メソッドに依存することがよくあります。それでも、ディープラーニングの適切なパフォーマンスは、大規模なデータセットと多様なサンプルを利用することで得られ、大規模なデータセットにスケーリングするための効率的なトレーニングパイプラインと、サンプルを多様化するためのデータ拡張技術の必要性を促します。ただし、現在のMILベースのWSI分類パイプラインは、通常、計算用のバッグとして数万のパッチを組み立てるため、メモリを消費し、計算効率が低くなります。一方、他のタスクで人気があるにもかかわらず、WSIMILフレームワークのデータ拡張は検討されていません。それらに対処するために、MILベースのWSI分類のための一般的で効率的なフレームワークであるReMixを提案します。それは2つのステップで構成されています:削減と混合。まず、インスタンスをインスタンスプロトタイプ、つまりパッチクラスターの重心に置き換えることで、WSIバッグ内のインスタンスの数を減らします。次に、4つのオンラインで確率的かつ柔軟な潜在空間拡張を含む「Mix-the-bag」拡張を提案します。これは、意味的摂動の不変性を強制しながら、潜在空間に多様で信頼性の高いクラスIDを保持する意味変化をもたらします。 2つの最先端のMILメソッドを使用して2つのパブリックデータセットでReMixを評価します。私たちの実験では、精度、精度、再現率の一貫した改善が達成されましたが、トレーニング時間とメモリ消費が大幅に削減され、ReMixの有効性と効率が実証されました。コードが利用可能です。
Whole slide image (WSI) classification often relies on deep weakly supervised multiple instance learning (MIL) methods to handle gigapixel resolution images and slide-level labels. Yet the decent performance of deep learning comes from harnessing massive datasets and diverse samples, urging the need for efficient training pipelines for scaling to large datasets and data augmentation techniques for diversifying samples. However, current MIL-based WSI classification pipelines are memory-expensive and computation-inefficient since they usually assemble tens of thousands of patches as bags for computation. On the other hand, despite their popularity in other tasks, data augmentations are unexplored for WSI MIL frameworks. To address them, we propose ReMix, a general and efficient framework for MIL based WSI classification. It comprises two steps: reduce and mix. First, it reduces the number of instances in WSI bags by substituting instances with instance prototypes, i.e., patch cluster centroids. Then, we propose a ``Mix-the-bag'' augmentation that contains four online, stochastic and flexible latent space augmentations. It brings diverse and reliable class-identity-preserving semantic changes in the latent space while enforcing semantic-perturbation invariance. We evaluate ReMix on two public datasets with two state-of-the-art MIL methods. In our experiments, consistent improvements in precision, accuracy, and recall have been achieved but with orders of magnitude reduced training time and memory consumption, demonstrating ReMix's effectiveness and efficiency. Code is available.
updated: Tue Jul 05 2022 04:21:35 GMT+0000 (UTC)
published: Tue Jul 05 2022 04:21:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト