医療データのプライバシー規制のため、集中データレイクで患者データを収集して共有することは、多くの場合実行不可能です。これは、多くの場合、多数の多様なトレーニング例を必要とする、深い畳み込みネットワークなどの機械学習アルゴリズムのトレーニングに課題をもたらします。連合学習は、患者データの所有者にコードを提供し、それらの間で中間モデルのトレーニングの更新のみを共有することにより、この困難を回避します。これらのモデルの更新を適切に集約することにより、高精度のモデルを実現できますが、共有されたモデルはローカルトレーニングの例から間接的に漏洩する可能性があります。このホワイトペーパーでは、フェデレーション学習の設定で患者のデータを保護するために、差分プライバシー手法を適用する可能性を調査します。 BraTSデータセットでの脳腫瘍セグメンテーションのための実用的な連合学習システムを実装および評価します。実験結果は、モデルのパフォーマンスとプライバシー保護コストの間にトレードオフがあることを示しています。
Due to medical data privacy regulations, it is often infeasible to collect and share patient data in a centralised data lake. This poses challenges for training machine learning algorithms, such as deep convolutional networks, which often require large numbers of diverse training examples. Federated learning sidesteps this difficulty by bringing code to the patient data owners and only sharing intermediate model training updates among them. Although a high-accuracy model could be achieved by appropriately aggregating these model updates, the model shared could indirectly leak the local training examples. In this paper, we investigate the feasibility of applying differential-privacy techniques to protect the patient data in a federated learning setup. We implement and evaluate practical federated learning systems for brain tumour segmentation on the BraTS dataset. The experimental results show that there is a trade-off between model performance and privacy protection costs.