下部消化管(GI)管のポリープを早期に特定することで、生命を脅かす結腸直腸癌の予防につながる可能性があります。ポリープを検出するためのコンピューター支援診断(CAD)システムを開発すると、検出の精度と効率が向上し、内視鏡医と呼ばれるドメインの専門家の時間を節約できます。注釈付きデータの欠如は、CADシステムを構築する際の一般的な課題です。合成医療データの生成は、医療分野で真の陽性症例が比較的少ないという問題を克服するための活発な研究分野です。 CADシステムのコアである機械学習(ML)モデルを効率的にトレーニングできるようにするには、かなりの量のデータを使用する必要があります。この点で、非ポリープ画像をポリープ画像に変換してトレーニング用のトレーニングデータセットのサイズを増やすことができるPolypConnectパイプラインを提案します。パイプライン全体に、内視鏡医が関与する定量的および定性的な評価を提示します。合成データと実際のデータを使用してトレーニングされたポリープセグメンテーションモデルは、実際のデータのみを使用してトレーニングされたモデルと比較して、ユニオン(mIOU)に対する平均交差の5.1%の改善を示しています。すべての実験のコードは、結果を再現するためにGitHubで入手できます。
Early identification of a polyp in the lower gastrointestinal (GI) tract can lead to prevention of life-threatening colorectal cancer. Developing computer-aided diagnosis (CAD) systems to detect polyps can improve detection accuracy and efficiency and save the time of the domain experts called endoscopists. Lack of annotated data is a common challenge when building CAD systems. Generating synthetic medical data is an active research area to overcome the problem of having relatively few true positive cases in the medical domain. To be able to efficiently train machine learning (ML) models, which are the core of CAD systems, a considerable amount of data should be used. In this respect, we propose the PolypConnect pipeline, which can convert non-polyp images into polyp images to increase the size of training datasets for training. We present the whole pipeline with quantitative and qualitative evaluations involving endoscopists. The polyp segmentation model trained using synthetic data, and real data shows a 5.1% improvement of mean intersection over union (mIOU), compared to the model trained only using real data. The codes of all the experiments are available on GitHub to reproduce the results.