フェデレーテッド ラーニング (FL) を使用すると、データを一元化することなく、複数の共同作業者からの多様なデータセットを活用することで、堅牢で一般化可能な AI モデルを構築できます。データ サイエンティストが FLARE を研究や実世界のアプリケーションで簡単に使用できるようにするために、オープンソースのソフトウェア開発キット (SDK) として NVIDIA FLARE を作成しました。 SDK には、最先端の FL アルゴリズムとフェデレーテッド機械学習アプローチのソリューションが含まれています。これにより、企業間での分散学習のためのワークフローの構築が容易になり、プラットフォーム開発者は、準同型暗号化または差分を利用したマルチパーティ コラボレーションのための安全でプライバシーを保護する製品を作成できます。プライバシー。 SDK は、軽量で柔軟かつスケーラブルな Python パッケージです。これにより、研究者は実際の FL 設定で、データ サイエンス ワークフローを任意のトレーニング ライブラリ (PyTorch、TensorFlow、XGBoost、さらには NumPy) に適用できます。このホワイト ペーパーでは、NVFlare の主要な設計原則を紹介し、さまざまなプライバシー保護アルゴリズムを実装するカスタマイズ可能な FL ワークフローを使用したいくつかのユース ケース (COVID 分析など) を示します。コードは https://github.com/NVIDIA/NVFlare で入手できます。
Federated learning (FL) enables building robust and generalizable AI models by leveraging diverse datasets from multiple collaborators without centralizing the data. We created NVIDIA FLARE as an open-source software development kit (SDK) to make it easier for data scientists to use FL in their research and real-world applications. The SDK includes solutions for state-of-the-art FL algorithms and federated machine learning approaches, which facilitate building workflows for distributed learning across enterprises and enable platform developers to create a secure, privacy-preserving offering for multiparty collaboration utilizing homomorphic encryption or differential privacy. The SDK is a lightweight, flexible, and scalable Python package. It allows researchers to apply their data science workflows in any training libraries (PyTorch, TensorFlow, XGBoost, or even NumPy) in real-world FL settings. This paper introduces the key design principles of NVFlare and illustrates some use cases (e.g., COVID analysis) with customizable FL workflows that implement different privacy-preserving algorithms. Code is available at https://github.com/NVIDIA/NVFlare.