データのプライバシーは、機械学習(ML)でますます重要な問題になっています。この課題に取り組むために、暗号化(ホモモルフィック暗号化(HE)、差分プライバシー(DP)など)や共同トレーニング(セキュアマルチ)など、多くのアプローチが開発されています。 -パーティ計算(MPC)、分散学習および連合学習(FL))。これらの手法は、データの暗号化または安全なローカル計算に特に重点を置いています。最終結果を計算するために、中間情報をサードパーティに転送します。勾配交換は、一般に、ディープラーニング(DL)で堅牢なモデルを共同でトレーニングするための安全な方法であると考えられています。ただし、最近の調査では、機密情報を共有勾配から復元できることが示されています。特に、Generative Adversarial Network(GAN)は、そのような情報を回復するのに効果的であることが示されています。ただし、GANベースの手法では、プライバシー保護された学習では一般的に利用できないクラスラベルなどの追加情報が必要です。この論文では、FLシステムにおいて、画像ベースのプライバシーデータは、提案されたGenerative Regression Neural Network(GRNN)を介してのみ、共有勾配から完全に簡単に復元できることを示します。攻撃を回帰問題として定式化し、勾配間の距離を最小化することにより、生成モデルの2つのブランチを最適化します。いくつかの画像分類タスクで私たちの方法を評価します。結果は、提案されたGRNNが、より優れた安定性、より強力な堅牢性、およびより高い精度で、最先端の方法よりも優れていることを示しています。また、グローバルFLモデルへの収束要件もありません。さらに、顔の再識別を使用して情報漏えいを示します。この作業では、いくつかの防御戦略についても説明します。
Data privacy has become an increasingly important issue in Machine Learning (ML), where many approaches have been developed to tackle this challenge, e.g. cryptography (Homomorphic Encryption (HE), Differential Privacy (DP), etc.) and collaborative training (Secure Multi-Party Computation (MPC), Distributed Learning and Federated Learning (FL)). These techniques have a particular focus on data encryption or secure local computation. They transfer the intermediate information to the third party to compute the final result. Gradient exchanging is commonly considered to be a secure way of training a robust model collaboratively in Deep Learning (DL). However, recent researches have demonstrated that sensitive information can be recovered from the shared gradient. Generative Adversarial Network (GAN), in particular, has shown to be effective in recovering such information. However, GAN based techniques require additional information, such as class labels which are generally unavailable for privacy-preserved learning. In this paper, we show that, in the FL system, image-based privacy data can be easily recovered in full from the shared gradient only via our proposed Generative Regression Neural Network (GRNN). We formulate the attack to be a regression problem and optimize two branches of the generative model by minimizing the distance between gradients. We evaluate our method on several image classification tasks. The results illustrate that our proposed GRNN outperforms state-of-the-art methods with better stability, stronger robustness, and higher accuracy. It also has no convergence requirement to the global FL model. Moreover, we demonstrate information leakage using face re-identification. Some defense strategies are also discussed in this work.