フェデレーテッド ラーニング (FL) は、分散型ローカル クライアントのモデル パラメーターを集約することによる最新の共同トレーニング フレームワークです。しかし、ほとんどの FL メソッドは、FL フレームワークのデータ カテゴリが事前に既知で固定されていると不当に想定しています。また、他のクライアントには見られない斬新なカテゴリーを集めた新規のローカルクライアントを不定期でFL研修にご紹介する場合もございます。これらの問題により、ローカル クライアントが古いカテゴリを保存する限られたメモリの下で新しいカテゴリを連続して受信すると、グローバル モデルが古いカテゴリを壊滅的に忘れてしまいます。上記の問題に取り組むために、新しい Local-Global Anti-forgetting (LGA) モデルを提案します。ローカルおよびグローバルな壊滅的な忘れに対処することで、ローカルのクライアントが継続的に新しいクラスを学習する際に取り残されることがなくなります。具体的には、ローカル忘却を克服するためにローカルクライアントのクラス不均衡に取り組むことを考慮して、カテゴリーバランスのとれた勾配適応補償損失とカテゴリー勾配誘発の意味蒸留損失を開発します。異なるタスク内で一貫したクラス関係を確保しながら、忘れにくい古いカテゴリと忘れやすい古いカテゴリの不均一な忘却速度のバランスを取ることができます。さらに、プロキシ サーバーは、異なるクライアント間の非 IID クラスの不均衡によって引き起こされるグローバルな忘却に対処するように設計されています。自己監視型プロトタイプ拡張を通じてローカル クライアントから収集された新しいカテゴリの摂動されたプロトタイプ画像を拡張し、ローカル側のセマンティック蒸留損失に対して最適な古いグローバル モデルを選択する堅牢性を向上させます。代表的なデータセットでの実験により、比較方法に対するモデルの優れたパフォーマンスが検証されます。コードは https://github.com/JiahuaDong/LGA で入手できます。
Federated learning (FL) is a hot collaborative training framework via aggregating model parameters of decentralized local clients. However, most FL methods unreasonably assume data categories of FL framework are known and fixed in advance. Moreover, some new local clients that collect novel categories unseen by other clients may be introduced to FL training irregularly. These issues render global model to undergo catastrophic forgetting on old categories, when local clients receive new categories consecutively under limited memory of storing old categories. To tackle the above issues, we propose a novel Local-Global Anti-forgetting (LGA) model. It ensures no local clients are left behind as they learn new classes continually, by addressing local and global catastrophic forgetting. Specifically, considering tackling class imbalance of local client to surmount local forgetting, we develop a category-balanced gradient-adaptive compensation loss and a category gradient-induced semantic distillation loss. They can balance heterogeneous forgetting speeds of hard-to-forget and easy-to-forget old categories, while ensure consistent class-relations within different tasks. Moreover, a proxy server is designed to tackle global forgetting caused by Non-IID class imbalance between different clients. It augments perturbed prototype images of new categories collected from local clients via self-supervised prototype augmentation, thus improving robustness to choose the best old global model for local-side semantic distillation loss. Experiments on representative datasets verify superior performance of our model against comparison methods. The code is available at https://github.com/JiahuaDong/LGA.