中期細胞の顕微鏡画像から自動化された染色体インスタンスのセグメンテーションは、染色体障害の診断 (すなわち、核型分析) にとって重要です。ただし、高密度に注釈が付けられたデータセットが不足していることや、染色体の複雑な形態 (高密度の分布、任意の方向、長さの範囲が広いなど) が原因で、依然として困難な作業です。この領域の開発を促進するために、私たちは大きな一歩を踏み出し、AutoKary2022 という名前の高密度に注釈が付けられた大規模なデータセットを手動で作成しました。このデータセットには、50 人の患者の 612 の顕微鏡画像に含まれる 27,000 を超える染色体インスタンスが含まれています。具体的には、正確な染色体の検出とセグメンテーションを支援するために、各インスタンスにポリゴン マスクとクラス ラベルの注釈が付けられます。その上で、このデータセットの代表的な方法を体系的に調査し、多くの興味深い発見を得て、染色体インスタンスのセグメンテーションの基本的な問題をより深く理解するのに役立ちます。このデータセットが医学的理解に向けた研究を前進させることを願っています。データセットは https://github.com/wangjuncongyu/chromosome-instance-segmentation-dataset で入手できます。
Automated chromosome instance segmentation from metaphase cell microscopic images is critical for the diagnosis of chromosomal disorders (i.e., karyotype analysis). However, it is still a challenging task due to lacking of densely annotated datasets and the complicated morphologies of chromosomes, e.g., dense distribution, arbitrary orientations, and wide range of lengths. To facilitate the development of this area, we take a big step forward and manually construct a large-scale densely annotated dataset named AutoKary2022, which contains over 27,000 chromosome instances in 612 microscopic images from 50 patients. Specifically, each instance is annotated with a polygonal mask and a class label to assist in precise chromosome detection and segmentation. On top of it, we systematically investigate representative methods on this dataset and obtain a number of interesting findings, which helps us have a deeper understanding of the fundamental problems in chromosome instance segmentation. We hope this dataset could advance research towards medical understanding. The dataset can be available at: https://github.com/wangjuncongyu/chromosome-instance-segmentation-dataset.