arXiv reaDer
ガウス差分プライバシーによるランダムミックスアップの最適化
Optimizing Random Mixup with Gaussian Differential Privacy
差分プライベートデータのリリースは、機械学習コミュニティで注目を集めています。最近、DPMixと呼ばれるアルゴリズムが提案され、差分プライバシーと次数mのランダムな混合の後に高次元データをリリースします。ただし、「スイートスポットm」現象については限られた理論的正当性が示され、画像データにDPMixを直接適用すると、有用性が大幅に失われます。この論文では、差分プライバシーに関する最近の進歩とのランダムな取り違えを再検討します。理論的には、ポアソンサブサンプリングを使用したガウス差分プライバシーを備えた厳密な閉形式の分析が提示され、線形回帰モデルに基づいて最適な混合m ^ *の定量的特性評価が可能になります。実際には、手工芸品または事前に訓練されたニューラルネットワーク(ラベルなしの自己監視学習など)によって抽出された特徴の組み合わせが採用され、プライバシー保護によってパフォーマンスが大幅に向上します。これをDifferentiallyPrivate Feature Mixup(DPFMix)と名付けます。 MNIST、CIFAR10 / 100の実験は、その顕著な有用性の向上と攻撃に対する保護を実証するために実施されます。
Differentially private data release receives rising attention in machine learning community. Recently, an algorithm called DPMix is proposed to release high-dimensional data after a random mixup of degree m with differential privacy. However, limited theoretical justifications are given about the "sweet spot m" phenomenon, and directly applying DPMix to image data suffers from severe loss of utility. In this paper, we revisit random mixup with recent progress on differential privacy. In theory, equipped with Gaussian Differential Privacy with Poisson subsampling, a tight closed form analysis is presented that enables a quantitative characterization of optimal mixup m^* based on linear regression models. In practice, mixup of features, extracted by handcraft or pre-trained neural networks such as self-supervised learning without labels, is adopted to significantly boost the performance with privacy protection. We name it as Differentially Private Feature Mixup (DPFMix). Experiments on MNIST, CIFAR10/100 are conducted to demonstrate its remarkable utility improvement and protection against attacks.
updated: Mon Feb 14 2022 03:01:05 GMT+0000 (UTC)
published: Mon Feb 14 2022 03:01:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト