arXiv reaDer
組織病理学画像分析のためのペトリ皿
A Petri Dish for Histopathology Image Analysis
ディープラーニングの台頭に伴い、病理学者が顕微鏡下で従来手動で検査していた生検または切除標本の特性を調査する分野である組織病理学画像分析にニューラルネットワークを使用することへの関心が高まっています。ただし、組織病理学の画像分析では、限られたデータ、コストのかかる注釈、高解像度の可変サイズの画像の処理などの課題により、参入障壁が高くなり、モデル設計をすばやく繰り返すことが困難になります。科学の歴史を通じて、多くの重要な研究の方向性は、小規模な実験装置をペトリ皿として活用して探索的アイデアを効率的に評価し、それを大規模なアプリケーションで検証してきました。たとえば、遺伝学のショウジョウバエやコンピュータービジョンのMNISTは、よく知られているペトリ皿です。この論文では、組織病理学画像分析のための類似のペトリ皿である、最小限の組織病理学画像分析データセット(MHIST)を紹介します。 MHISTは、結腸直腸ポリープの3,152の固定サイズ画像の二項分類データセットであり、それぞれに7人の理事会認定胃腸病理学者の多数決とアノテーター合意レベルによって決定されたゴールドスタンダードラベルが付いています。 MHISTは400MB未満のディスク領域を占有し、ResNet-18ベースラインはNVIDIA RTX3090の3.5GBのメモリを使用してわずか6分でMHISTに収束するようにトレーニングできます。使用例として、MHISTを使用して自然な質問を研究しますデータセットのサイズ、ネットワークの深さ、転送学習、不一致の多い例がモデルのパフォーマンスにどのように影響するかなど。 MHISTを導入することにより、現在の組織病理学画像研究者の作業を容易にするだけでなく、組織病理学画像分析を一般的なコンピュータービジョンコミュニティがより利用しやすくすることを望んでいます。私たちのデータセットはhttps://bmirds.github.io/MHISTで入手できます。
With the rise of deep learning, there has been increased interest in using neural networks for histopathology image analysis, a field that investigates the properties of biopsy or resected specimens that are traditionally manually examined under a microscope by pathologists. In histopathology image analysis, however, challenges such as limited data, costly annotation, and processing high-resolution and variable-size images create a high barrier of entry and make it difficult to quickly iterate over model designs. Throughout scientific history, many significant research directions have leveraged small-scale experimental setups as petri dishes to efficiently evaluate exploratory ideas, which are then validated in large-scale applications. For instance, the Drosophila fruit fly in genetics and MNIST in computer vision are well-known petri dishes. In this paper, we introduce a minimalist histopathology image analysis dataset (MHIST), an analogous petri dish for histopathology image analysis. MHIST is a binary classification dataset of 3,152 fixed-size images of colorectal polyps, each with a gold-standard label determined by the majority vote of seven board-certified gastrointestinal pathologists and annotator agreement level. MHIST occupies less than 400 MB of disk space, and a ResNet-18 baseline can be trained to convergence on MHIST in just 6 minutes using 3.5 GB of memory on a NVIDIA RTX 3090. As example use cases, we use MHIST to study natural questions such as how dataset size, network depth, transfer learning, and high-disagreement examples affect model performance. By introducing MHIST, we hope to not only help facilitate the work of current histopathology imaging researchers, but also make histopathology image analysis more accessible to the general computer vision community. Our dataset is available at https://bmirds.github.io/MHIST.
updated: Fri Jan 29 2021 02:01:45 GMT+0000 (UTC)
published: Fri Jan 29 2021 02:01:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト