arXiv reaDer
断続的なクライアントを使用した医用画像処理のためのフェデレーテッド ラーニングのパフォーマンスとスケーラビリティの研究
Study of the performance and scalability of federated learning for medical imaging with intermittent clients
フェデレーテッド ラーニングは、機械学習またはディープ ラーニングを安全な方法で実行するために使用される、データ分散化のプライバシー保護技術です。この論文では、集約演算子の提示、さまざまなタイプの連合学習、およびクライアントからのデータの配布に関して考慮すべき問題など、連合学習に関する理論的側面を、以下の徹底的な分析とともに提示します。クライアント数が変化するユースケース。具体的には、オープンデータレポジトリから取得した胸部X線画像を用いた医用画像解析のユースケースを提案します。プライバシーに関連する利点に加えて、予測の改善 (精度、損失、および曲線下面積の観点から) と実行時間の短縮が、従来のケース (集中型アプローチ) に関して研究されます。不均衡な方法で選択されたトレーニング データから、さまざまなクライアントがシミュレートされます。 3 人または 10 人のクライアントを考慮した結果が公開され、それらの間および集中型のケースと比較されます。断続的なクライアントに関連する 2 つの異なる問題について、それぞれに従うべき 2 つのアプローチとともに説明します。具体的には、この種の問題が発生する可能性があります。実際のシナリオでは、一部のクライアントがトレーニングを終了し、他のクライアントがトレーニングに参加する可能性があり、一方でクライアントの技術的または接続の問題が原因で発生する可能性があります。最後に、フィールドでの改善と将来の作業が提案されます。
Federated learning is a data decentralization privacy-preserving technique used to perform machine or deep learning in a secure way. In this paper we present theoretical aspects about federated learning, such as the presentation of an aggregation operator, different types of federated learning, and issues to be taken into account in relation to the distribution of data from the clients, together with the exhaustive analysis of a use case where the number of clients varies. Specifically, a use case of medical image analysis is proposed, using chest X-Ray images obtained from an open data repository. In addition to the advantages related to privacy, improvements in predictions (in terms of accuracy, loss and area under the curve) and reduction of execution times will be studied with respect to the classical case (the centralized approach). Different clients will be simulated from the training data, selected in an unbalanced manner. The results of considering three or ten clients are exposed and compared between them and against the centralized case. Two different problems related to intermittent clients are discussed, together with two approaches to be followed for each of them. Specifically, this type of problems may occur because in a real scenario some clients may leave the training, and others enter it, and on the other hand because of client technical or connectivity problems. Finally, improvements and future work in the field are proposed.
updated: Thu Nov 03 2022 13:05:25 GMT+0000 (UTC)
published: Mon Jul 18 2022 13:18:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト