arXiv reaDer
発散を意識した連合自己監視学習
Divergence-aware Federated Self-Supervised Learning
自己監視学習(SSL)は、一元的に利用可能なデータから注目に値する表現を学習することができます。最近の研究では、SSLを使用した連合学習をさらに実装して、プライバシーの制約から生じることが多い、急速に成長する分散型のラベルなし画像(カメラや電話など)から学習します。シャムネットワークに基づくSSLアプローチに大きな注目が集まっています。ただし、そのような取り組みでは、フェデレーション自己監視学習(FedSSL)アーキテクチャのさまざまな基本的な構成要素に対する深い洞察はまだ明らかにされていません。徹底的な実証研究を通じてこのギャップを埋めることを目指し、分散データの非独立かつ同一分布(非IID)データの問題に取り組むための新しい方法を提案します。まず、シャムネットワークに基づく既存のSSLメソッドを採用し、将来のメソッドに対応する柔軟性を提供する、一般化されたFedSSLフレームワークを紹介します。このフレームワークでは、サーバーが複数のクライアントを調整してSSLトレーニングを実施し、クライアントのローカルモデルを集約されたグローバルモデルで定期的に更新します。フレームワークを使用して、私たちの研究はFedSSLのユニークな洞察を明らかにします。1)以前に不可欠であると報告された停止勾配操作は、FedSSLでは必ずしも必要ではありません。 2)FedSSLでクライアントのローカル知識を保持することは、非IIDデータにとって特に有益です。次に、洞察に触発されて、モデル更新の新しいアプローチである、フェデレーションダイバージェンス対応の指数移動平均更新(FedEMA)を提案します。 FedEMAは、グローバルモデルのEMAを使用して、クライアントのローカルモデルを適応的に更新します。この場合、減衰率はモデルの発散によって動的に測定されます。広範な実験により、FedEMAは線形評価で既存の方法よりも3〜4%優れていることが示されています。この研究が将来の研究に役立つ洞察を提供することを願っています。
Self-supervised learning (SSL) is capable of learning remarkable representations from centrally available data. Recent works further implement federated learning with SSL to learn from rapidly growing decentralized unlabeled images (e.g., from cameras and phones), often resulted from privacy constraints. Extensive attention has been paid to SSL approaches based on Siamese networks. However, such an effort has not yet revealed deep insights into various fundamental building blocks for the federated self-supervised learning (FedSSL) architecture. We aim to fill in this gap via in-depth empirical study and propose a new method to tackle the non-independently and identically distributed (non-IID) data problem of decentralized data. Firstly, we introduce a generalized FedSSL framework that embraces existing SSL methods based on Siamese networks and presents flexibility catering to future methods. In this framework, a server coordinates multiple clients to conduct SSL training and periodically updates local models of clients with the aggregated global model. Using the framework, our study uncovers unique insights of FedSSL: 1) stop-gradient operation, previously reported to be essential, is not always necessary in FedSSL; 2) retaining local knowledge of clients in FedSSL is particularly beneficial for non-IID data. Inspired by the insights, we then propose a new approach for model update, Federated Divergence-aware Exponential Moving Average update (FedEMA). FedEMA updates local models of clients adaptively using EMA of the global model, where the decay rate is dynamically measured by model divergence. Extensive experiments demonstrate that FedEMA outperforms existing methods by 3-4% on linear evaluation. We hope that this work will provide useful insights for future research.
updated: Sat Apr 09 2022 04:15:02 GMT+0000 (UTC)
published: Sat Apr 09 2022 04:15:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト