ピクセル単位の画像セグメンテーションは、医療画像分析において非常に厳しいタスクです。実際には、対応するセグメンテーションマスクを持つ注釈付きの医療画像を見つけることは困難です。この論文では、Kvasir-SEG:胃腸ポリープ画像と対応するセグメンテーションマスクのオープンアクセスデータセットを提示します。医師によって手動で注釈が付けられ、その後、経験豊富な胃腸科医によって検証されます。さらに、セグメンテーションマスクを使用して、ポリープ領域の境界ボックスも生成しました。従来のセグメンテーションアプローチと現代の深層学習ベースの畳み込みニューラルネットワーク(CNN)アプローチでのデータセットの使用を示します。このデータセットは、研究者が結果を再現し、方法を比較するのに役立ちます。フレーム単位の注釈のみを提供するセグメンテーションマスクをKvasirデータセットに追加することにより、マルチメディアおよびコンピュータービジョンの研究者がポリープセグメンテーションおよび大腸内視鏡検査画像の自動分析の分野に貢献できるようにします。
Pixel-wise image segmentation is a highly demanding task in medical-image analysis. In practice, it is difficult to find annotated medical images with corresponding segmentation masks. In this paper, we present Kvasir-SEG: an open-access dataset of gastrointestinal polyp images and corresponding segmentation masks, manually annotated by a medical doctor and then verified by an experienced gastroenterologist. Moreover, we also generated the bounding boxes of the polyp regions with the help of segmentation masks. We demonstrate the use of our dataset with a traditional segmentation approach and a modern deep-learning based Convolutional Neural Network (CNN) approach. The dataset will be of value for researchers to reproduce results and compare methods. By adding segmentation masks to the Kvasir dataset, which only provide frame-wise annotations, we enable multimedia and computer vision researchers to contribute in the field of polyp segmentation and automatic analysis of colonoscopy images.