Real-World Image Datasets for Federated Learning
 フェデレーテッドラーニングは、データパーティがデータを安全かつプライベートに保ちながら、機械学習モデルを共同で構築できる新しい機械学習パラダイムです。フェデレーション学習の研究努力は過去2年間で飛躍的に成長していますが、実際のエッジから生成された高品質のラベル付きデータが不足しているため、ほとんどの既存の作品はデータフェデレーションをシミュレートするために既存のパブリックデータセットと人工パーティションに依拠していますアプリケーション。その結果、連合学習のベンチマークとモデル評価の進歩は遅れをとっています。このペーパーでは、実世界の画像データセットを紹介します。データセットには、26個の街路カメラから生成された900以上の画像と、詳細な境界ボックスで注釈が付けられた7つのオブジェクトカテゴリが含まれています。データ分布は非IIDで不均衡であり、特徴的な実世界の連合学習シナリオを反映しています。このデータセットに基づいて、2つの主流オブジェクト検出アルゴリズム(YOLOおよびFaster R-CNN)を実装し、連合学習設定でのモデルのパフォーマンス、効率、およびコミュニケーションに関する広範なベンチマークを提供しました。データセットとアルゴリズムの両方が公開されています。
Federated learning is a new machine learning paradigm which allows data parties to build machine learning models collaboratively while keeping their data secure and private. While research efforts on federated learning have been growing tremendously in the past two years, most existing works still depend on pre-existing public datasets and artificial partitions to simulate data federations due to the lack of high-quality labeled data generated from real-world edge applications. Consequently, advances on benchmark and model evaluations for federated learning have been lagging behind. In this paper, we introduce a real-world image dataset. The dataset contains more than 900 images generated from 26 street cameras and 7 object categories annotated with detailed bounding box. The data distribution is non-IID and unbalanced, reflecting the characteristic real-world federated learning scenarios. Based on this dataset, we implemented two mainstream object detection algorithms (YOLO and Faster R-CNN) and provided an extensive benchmark on model performance, efficiency, and communication in a federated learning setting. Both the dataset and algorithms are made publicly available.
updated: Tue Jan 05 2021 06:31:32 GMT+0000 (UTC)
published: Mon Oct 14 2019 09:33:26 GMT+0000 (UTC)
