コンピューター支援診断(CAD)は、病理医が癌の一貫性と再現性とともに診断精度を向上させるのに役立ちます。ただし、単一のセンター(病院)からの組織病理学的画像のみでトレーニングされたCADモデルは、一般に、異なるセンター間のひずみの不一致のために一般化の問題に悩まされます。この作業では、CADモデルの診断精度と一般化の両方を改善するために、SSL-FT-BTという名前の疑似データベースの自己監視連合学習(FL)フレームワークを提案します。具体的には、疑似組織病理学的画像が各センターから生成されます。この画像には、このセンターの実際の画像に対応する固有の特定のプロパティが含まれていますが、プライバシー情報は含まれていません。これらの疑似画像は、自己監視学習(SSL)のために中央サーバーで共有されます。次に、マルチタスクSSLは、データの特性に応じて、センター固有の情報と一般的な固有の表現の両方を完全に学習するように設計されています。さらに、FL手順でのグローバルモデルの最適化に役立つ対照的な学習を実施することにより、各センターでのCADモデルのローカルトレーニングを改善するために、新しいBarlow TwinsベースのFL(FL-BT)アルゴリズムが提案されています。 3つの公開された組織病理学的画像データセットの実験結果は、診断精度と一般化の両方で提案されたSSL-FL-BTの有効性を示しています。
Computer-aided diagnosis (CAD) can help pathologists improve diagnostic accuracy together with consistency and repeatability for cancers. However, the CAD models trained with the histopathological images only from a single center (hospital) generally suffer from the generalization problem due to the straining inconsistencies among different centers. In this work, we propose a pseudo-data based self-supervised federated learning (FL) framework, named SSL-FT-BT, to improve both the diagnostic accuracy and generalization of CAD models. Specifically, the pseudo histopathological images are generated from each center, which contains inherent and specific properties corresponding to the real images in this center, but does not include the privacy information. These pseudo images are then shared in the central server for self-supervised learning (SSL). A multi-task SSL is then designed to fully learn both the center-specific information and common inherent representation according to the data characteristics. Moreover, a novel Barlow Twins based FL (FL-BT) algorithm is proposed to improve the local training for the CAD model in each center by conducting contrastive learning, which benefits the optimization of the global model in the FL procedure. The experimental results on three public histopathological image datasets indicate the effectiveness of the proposed SSL-FL-BT on both diagnostic accuracy and generalization.