arXiv reaDer
FHIST:組織学的画像の数ショット分類のベンチマーク
FHIST: A Benchmark for Few-shot Classification of Histological Images
最近、画像分類に幅広い関心を集めているショット学習はほとんどありませんが、現在の公開ベンチマークのほとんどすべてが自然画像に焦点を合わせています。注釈は高価であり、専門的な専門知識を必要とするため、ラベル付けされたデータが不足しているため、数ショットのパラダイムは医用画像アプリケーションに非常に関連しています。ただし、医用画像では、数ショットの学習研究はまばらで、プライベートデータセットに限定されており、初期段階にあります。特に、数ショットの設定は、癌関連の組織分類タスクの多様性と細分性、およびデータ準備技術の多様性のために、組織学で非常に興味深いものです。このホワイトペーパーでは、さまざまな公開データセットから収集された、少数の組織学データを分類するための高度に多様化された公開ベンチマークを紹介します。さまざまな組織タイプ、さまざまながん部位に起因するさまざまなレベルのドメインシフト、さまざまなクラス粒度レベルを使用して、数ショットのタスクとベーストレーニングデータを構築し、現実的なシナリオを反映します。ベンチマークで最先端の数ショット学習方法のパフォーマンスを評価し、単純な微調整と正則化の方法が、一般的なメタ学習とエピソードトレーニングのパラダイムよりも優れた結果を達成することを確認します。さらに、ソースとターゲットの組織学データ間のドメインシフトに基づいて、ニアドメイン、ミドルドメイン、アウトドメインの3つのシナリオを紹介します。私たちの実験は、組織学分類における数ショット学習の可能性を示しており、最先端の数ショット学習方法が、ニアドメイン設定の教師あり学習ベースラインに近づいています。私たちのアウトドメイン設定では、5ウェイ5ショットの場合、最高のパフォーマンスを発揮する方法は60%の精度に達します。私たちの仕事は、数ショットの学習方法の現実的な評価と公正な比較を構築するのに役立ち、数ショットのパラダイムでの研究をさらに促進すると信じています。
Few-shot learning has recently attracted wide interest in image classification, but almost all the current public benchmarks are focused on natural images. The few-shot paradigm is highly relevant in medical-imaging applications due to the scarcity of labeled data, as annotations are expensive and require specialized expertise. However, in medical imaging, few-shot learning research is sparse, limited to private data sets and is at its early stage. In particular, the few-shot setting is of high interest in histology due to the diversity and fine granularity of cancer related tissue classification tasks, and the variety of data-preparation techniques. This paper introduces a highly diversified public benchmark, gathered from various public datasets, for few-shot histology data classification. We build few-shot tasks and base-training data with various tissue types, different levels of domain shifts stemming from various cancer sites, and different class-granularity levels, thereby reflecting realistic scenarios. We evaluate the performances of state-of-the-art few-shot learning methods on our benchmark, and observe that simple fine-tuning and regularization methods achieve better results than the popular meta-learning and episodic-training paradigm. Furthermore, we introduce three scenarios based on the domain shifts between the source and target histology data: near-domain, middle-domain and out-domain. Our experiments display the potential of few-shot learning in histology classification, with state-of-art few shot learning methods approaching the supervised-learning baselines in the near-domain setting. In our out-domain setting, for 5-way 5-shot, the best performing method reaches 60% accuracy. We believe that our work could help in building realistic evaluations and fair comparisons of few-shot learning methods and will further encourage research in the few-shot paradigm.
updated: Tue May 31 2022 20:03:40 GMT+0000 (UTC)
published: Tue May 31 2022 20:03:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト