Gradient-Leaks: Understanding and Controlling Deanonymization in Federated Learning
フェデレーテッドラーニング(FL)システムは、個人データ(スマートフォンなど)で収集された大規模なユーザーデータから生データがデバイスを離れることなく機械学習(ML)モデルをトレーニングするソリューションとして人気を集めています。 FLの中核は、個人データでローカルに計算されたトレーニング情報(モデルパラメーターの更新)を共有する匿名ユーザーデバイスのネットワークです。ただし、モデルの更新でユーザー固有の情報がエンコードされるタイプと程度は、十分に理解されていません。このホワイトペーパーでは、ユーザーがデータをキャプチャして生成する微妙なバリエーションをエンコードするモデル更新を特定します。バリエーションは強力な統計信号を提供し、攻撃者が限られた補助データのセットを使用して、参加しているデバイスを効果的に匿名化できるようにします。私たちは、閉ざされた世界と開かれた世界のさまざまなシナリオにわたって、実際の(匿名化された)ユーザーが生成したデータのさまざまなタスクに対する匿名化攻撃の結果を分析します。匿名化のリスクを軽減するためのさまざまな戦略を検討します。ランダム摂動法は説得力のある動作点を提供しないため、デバイスデータに敵対的なバイアスを導入し、ユーティリティへの影響がほとんどない匿名化の脅威に対する実質的な保護を提供するデータ拡張戦略を提案します。
Federated Learning (FL) systems are gaining popularity as a solution to training Machine Learning (ML) models from large-scale user data collected on personal devices (e.g., smartphones) without their raw data leaving the device. At the core of FL is a network of anonymous user devices sharing training information (model parameter updates) computed locally on personal data. However, the type and degree to which user-specific information is encoded in the model updates is poorly understood. In this paper, we identify model updates encode subtle variations in which users capture and generate data. The variations provide a strong statistical signal, allowing an adversary to effectively deanonymize participating devices using a limited set of auxiliary data. We analyze resulting deanonymization attacks on diverse tasks on real-world (anonymized) user-generated data across a range of closed- and open-world scenarios. We study various strategies to mitigate the risks of deanonymization. As random perturbation methods do not offer convincing operating points, we propose data-augmentation strategies which introduces adversarial biases in device data and thereby, offer substantial protection against deanonymization threats with little effect on utility.
updated: Sun Sep 13 2020 15:56:36 GMT+0000 (UTC)
published: Tue May 15 2018 15:12:45 GMT+0000 (UTC)
