arXiv reaDer
StatMix:連合学習で画像統計に依存するデータ拡張方法
StatMix: Data augmentation method that relies on image statistics in federated learning
大量の注釈付きデータの可用性は、ディープラーニングの成功の柱の1つです。多数の大きなデータセットが研究に利用できるようになっていますが、これは実際のアプリケーションには当てはまらないことがよくあります(たとえば、GDPRや知的財産権保護に関連する懸念のために企業はデータを共有できません)。連合学習(FL)は、ローカルデータ自体を共有することなく、複数のノードに分散するデータでグローバルモデルをトレーニングできるため、この問題の潜在的な解決策です。ただし、FLメソッドでさえ、適切に処理されない場合、データのプライバシーに脅威をもたらします。したがって、FLシナリオの結果を改善するために、画像統計を使用する拡張アプローチであるStatMixを提案します。 StatMixは、2つのニューラルネットワークアーキテクチャを使用して、CIFAR-10およびCIFAR-100で経験的にテストされています。すべてのFL実験で、StatMixを適用すると、ベースライントレーニング(StatMixを使用しない場合)と比較して、平均精度が向上します。非FLセットアップでもいくつかの改善が見られます。
Availability of large amount of annotated data is one of the pillars of deep learning success. Although numerous big datasets have been made available for research, this is often not the case in real life applications (e.g. companies are not able to share data due to GDPR or concerns related to intellectual property rights protection). Federated learning (FL) is a potential solution to this problem, as it enables training a global model on data scattered across multiple nodes, without sharing local data itself. However, even FL methods pose a threat to data privacy, if not handled properly. Therefore, we propose StatMix, an augmentation approach that uses image statistics, to improve results of FL scenario(s). StatMix is empirically tested on CIFAR-10 and CIFAR-100, using two neural network architectures. In all FL experiments, application of StatMix improves the average accuracy, compared to the baseline training (with no use of StatMix). Some improvement can also be observed in non-FL setups.
updated: Fri Jul 08 2022 19:02:41 GMT+0000 (UTC)
published: Fri Jul 08 2022 19:02:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト