arXiv reaDer
医用画像データセットにおけるコミュニティ検出:ウェーブレットとスペクトル法の使用
Community Detection in Medical Image Datasets: Using Wavelets and Spectral Methods
医用画像データセットには、さまざまな健康状態やさまざまな病気の重症度を持つ患者を表す多数の画像を含めることができます。ラベルのない生の画像データセットを扱う場合、サンプルの数が多いと、専門家や非専門家がデータセットに存在するさまざまな画像を理解するのが困難になることがよくあります。教師あり学習方法は、ラベル付けされた画像に依存します。これには、最初にデータに存在する画像のコミュニティを理解し、次に画像にラベルを付けるために、医療専門家によるかなりの努力が必要です。ここでは、医用画像データセット内のコミュニティの自動識別を容易にするアルゴリズムを提案します。さらに、画像にすでにラベルが付けられている場合、そのような分析は監視された設定でも洞察に満ちている可能性があることを説明します。実際には、健康と病気の重症度は連続スペクトルと見なすことができ、各クラス内には、特に他のクラスのコミュニティと類似している場合、調査に値するより細かいコミュニティが通常存在するため、このような洞察は有用です。私たちのアプローチでは、スペクトル法と組み合わせて画像のウェーブレット分解を使用します。グラフラプラシアンの固有値が、画像データセット内の注目すべきコミュニティの数を明らかにできることを示します。私たちの実験では、COVID患者のためにさまざまな条件でラベル付けされた画像のデータセットを使用します。データセットで25のコミュニティを検出し、それらのコミュニティのうち6つだけが肺炎の患者を含んでいることを観察します。また、結腸直腸癌の組織病理学的データセットの内容を調査します。
Medical image datasets can have large number of images representing patients with different health conditions and various disease severity. When dealing with raw unlabeled image datasets, the large number of samples often makes it hard for experts and non-experts to understand the variety of images present in a dataset. Supervised learning methods rely on labeled images which requires a considerable effort by medical experts to first understand the communities of images present in the data and then labeling the images. Here, we propose an algorithm to facilitate the automatic identification of communities in medical image datasets. We further explain that such analysis can also be insightful in a supervised setting, when the images are already labeled. Such insights are useful because in reality, health and disease severity can be considered a continuous spectrum, and within each class, there usually are finer communities worthy of investigation, especially when they have similarities to communities in other classes. In our approach, we use wavelet decomposition of images in tandem with spectral methods. We show that the eigenvalues of a graph Laplacian can reveal the number of notable communities in an image dataset. In our experiments, we use a dataset of images labeled with different conditions for COVID patients. We detect 25 communities in the dataset and then observe that only 6 of those communities contain patients with pneumonia. We also investigate the contents of a colorectal cancer histopathology dataset.
updated: Wed Dec 22 2021 16:47:10 GMT+0000 (UTC)
published: Wed Dec 22 2021 16:47:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト