arXiv reaDer
PolypGen: 汎化性評価のための多施設ポリープ検出およびセグメンテーション データセット
PolypGen: A multi-center polyp detection and segmentation dataset for generalisability assessment
結腸のポリープは、症状の診断精密検査、結腸直腸ガンのスクリーニング、または特定の疾患の系統的監視に関連する結腸内視鏡検査によって特定されるガンの前駆体として広く知られています。ほとんどのポリープは良性ですが、ポリープの数、サイズ、表面構造は結腸がんのリスクと密接に関係しています。さまざまな性質、異常の描写の難しさ、高い再発率、結腸の解剖学的トポグラフィーのために、結腸ポリープの高い検出率と不完全な除去が存在します。これまで、ポリープの検出とセグメンテーションを自動化するために、いくつかの方法が構築されてきました。ただし、ほとんどの方法の重要な問題は、それらが大規模なマルチセンター専用のデータセットで厳密にテストされていないことです。したがって、これらの方法は、特定の人口と内視鏡的監視に過剰適合するため、異なる人口データセットに一般化できない場合があります。この範囲で、300 人以上の患者を含む 6 つの異なるセンターからのデータセットをキュレーションしました。データセットには、6 人の上級消化器専門医によって検証されたポリープ境界の正確な描写を備えた 3446 個の注釈付きポリープ ラベルを含む単一フレームとシーケンス データの両方が含まれています。私たちの知る限り、これは、計算科学者と消化器専門医のチームによってキュレーションされた、最も包括的な検出およびピクセル レベルのセグメンテーション データセットです。このデータセットは、ポリープの検出とセグメンテーションの一般化可能性に対処することを目的とした Endocv2021 チャレンジの一部として作成されました。このペーパーでは、PolypGen と呼ばれる拡張された EndoCV2021 データセットのデータ構築とアノテーション戦略、アノテーションの品質保証、および技術的検証に関する包括的な洞察を提供します。
Polyps in the colon are widely known as cancer precursors identified by colonoscopy either related to diagnostic work-up for symptoms, colorectal cancer screening or systematic surveillance of certain diseases. Whilst most polyps are benign, the number, size and the surface structure of the polyp are tightly linked to the risk of colon cancer. There exists a high missed detection rate and incomplete removal of colon polyps due to the variable nature, difficulties to delineate the abnormality, high recurrence rates and the anatomical topography of the colon. In the past, several methods have been built to automate polyp detection and segmentation. However, the key issue of most methods is that they have not been tested rigorously on a large multi-center purpose-built dataset. Thus, these methods may not generalise to different population datasets as they overfit to a specific population and endoscopic surveillance. To this extent, we have curated a dataset from 6 different centers incorporating more than 300 patients. The dataset includes both single frame and sequence data with 3446 annotated polyp labels with precise delineation of polyp boundaries verified by six senior gastroenterologists. To our knowledge, this is the most comprehensive detection and pixel-level segmentation dataset curated by a team of computational scientists and expert gastroenterologists. This dataset has been originated as the part of the Endocv2021 challenge aimed at addressing generalisability in polyp detection and segmentation. In this paper, we provide comprehensive insight into data construction and annotation strategies, annotation quality assurance and technical validation for our extended EndoCV2021 dataset which we refer to as PolypGen.
updated: Tue Jun 08 2021 15:48:17 GMT+0000 (UTC)
published: Tue Jun 08 2021 15:48:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト