arXiv reaDer
Ensemble Cross-Domain Knowledge Distillation による Federated Learning におけるプライバシーの保護
Preserving Privacy in Federated Learning with Ensemble Cross-Domain Knowledge Distillation
フェデレーテッド ラーニング (FL) は、トレーニング データが分散化されたまま、ローカル ノードが中央モデルを共同でトレーニングする機械学習パラダイムです。既存の FL メソッドは、通常、モデル パラメーターを共有するか、共蒸留を使用して、不均衡なデータ分布の問題に対処します。ただし、通信のボトルネックに悩まされています。さらに重要なことに、プライバシーが漏洩するリスクがあります。この作業では、ラベル付けされていないクロスドメインのパブリックデータを使用して、ワンショットのオフライン知識蒸留を使用して、FL フレームワークでプライバシーを保護し、通信効率の高い方法を開発します。精度を犠牲にすることなく、より強力なプライバシー保証のために、完全にトレーニングされたローカル モデルからのローカル予測の量子化されたノイズの多いアンサンブルを提案します。画像分類タスクとテキスト分類タスクに関する広範な実験に基づいて、プライバシーを保護する方法がベースライン FL アルゴリズムよりも優れており、精度と通信効率の両方で優れていることを示しています。
Federated Learning (FL) is a machine learning paradigm where local nodes collaboratively train a central model while the training data remains decentralized. Existing FL methods typically share model parameters or employ co-distillation to address the issue of unbalanced data distribution. However, they suffer from communication bottlenecks. More importantly, they risk privacy leakage. In this work, we develop a privacy preserving and communication efficient method in a FL framework with one-shot offline knowledge distillation using unlabeled, cross-domain public data. We propose a quantized and noisy ensemble of local predictions from completely trained local models for stronger privacy guarantees without sacrificing accuracy. Based on extensive experiments on image classification and text classification tasks, we show that our privacy-preserving method outperforms baseline FL algorithms with superior performance in both accuracy and communication efficiency.
updated: Sat Sep 10 2022 05:20:31 GMT+0000 (UTC)
published: Sat Sep 10 2022 05:20:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト