arXiv reaDer
合成データ シャッフルにより、データの異質性下でのフェデレーション ラーニングの収束が加速されます。
Synthetic data shuffling accelerates the convergence of federated learning under data heterogeneity
フェデレーテッド ラーニングでは、データの異質性が重要な課題です。簡単な解決策は、クライアントのデータをシャッフルして分布を均一化することです。ただし、これはデータ アクセス権を侵害する可能性があり、シャッフルによって連合最適化アルゴリズムの収束がいつどのように加速されるかは、理論的には十分に理解されていません。この論文では、データの一部がクライアント間でシャッフルされた場合の、データの異質性と収束率のパラメーターとの間の正確かつ定量化可能な対応関係を確立します。シャッフルにより、シャッフルのパーセンテージに関して勾配の非類似性が二次関数的に減少し、収束が加速されることを証明します。この理論に触発されて、ローカルで生成された合成データをシャッフルすることでデータ アクセス権の問題に対処する実用的なアプローチを提案します。実験結果は、合成データをシャッフルすると、複数の既存の連合学習アルゴリズムのパフォーマンスが大幅に向上することを示しています。
In federated learning, data heterogeneity is a critical challenge. A straightforward solution is to shuffle the clients' data to homogenize the distribution. However, this may violate data access rights, and how and when shuffling can accelerate the convergence of a federated optimization algorithm is not theoretically well understood. In this paper, we establish a precise and quantifiable correspondence between data heterogeneity and parameters in the convergence rate when a fraction of data is shuffled across clients. We prove that shuffling can quadratically reduce the gradient dissimilarity with respect to the shuffling percentage, accelerating convergence. Inspired by the theory, we propose a practical approach that addresses the data access rights issue by shuffling locally generated synthetic data. The experimental results show that shuffling synthetic data improves the performance of multiple existing federated learning algorithms by a large margin.
updated: Fri Jun 23 2023 02:19:52 GMT+0000 (UTC)
published: Fri Jun 23 2023 02:19:52 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト