Federated Learningを使用すると、モバイルデバイスからの実世界のデータを使用して、プライバシーを保護する方法で視覚モデルをトレーニングできます。分散された性質を考えると、これらのデバイス間でのデータの統計は大幅に異なる可能性があります。この作業では、このような非同一のデータ分布が連合学習による視覚分類に与える影響を調べます。連続した同一範囲のデータセットを合成し、Federated Averagingアルゴリズムのパフォーマンス指標を提供する方法を提案します。分布が異なるとパフォーマンスが低下することを示し、サーバーの勢いによる緩和戦略を提案します。 CIFAR-10の実験では、非同一性の範囲で分類パフォーマンスが改善され、最も歪んだ設定で分類精度が30.1%から76.9%に改善されたことが実証されています。
Federated Learning enables visual models to be trained in a privacy-preserving way using real-world data from mobile devices. Given their distributed nature, the statistics of the data across these devices is likely to differ significantly. In this work, we look at the effect such non-identical data distributions has on visual classification via Federated Learning. We propose a way to synthesize datasets with a continuous range of identicalness and provide performance measures for the Federated Averaging algorithm. We show that performance degrades as distributions differ more, and propose a mitigation strategy via server momentum. Experiments on CIFAR-10 demonstrate improved classification performance over a range of non-identicalness, with classification accuracy improved from 30.1% to 76.9% in the most skewed settings.