トレーニングされたニューラル ネットワークのトレーニング セットからサンプルを再構築することは、プライバシーに関する大きな懸念事項です。ハイム等。 (2022) は最近、勾配法の暗黙のバイアスに関する理論的結果に基づいて、ニューラル ネットワークのバイナリ分類器からトレーニング サンプルを再構築できることを示しました。この作業では、この以前の作業に対するいくつかの改善点と新しい洞察を示します。主な改善点として、マルチクラス設定でトレーニングデータの再構築が可能であり、再構築の品質がバイナリ分類の場合よりもさらに高いことを示します。さらに、トレーニング中に重量減衰を使用すると、サンプルの再構築に対する脆弱性が高まることを示しています。最後に、前の作業ではトレーニング セットのサイズは 10 クラスから最大で 1000 でしたが、100 クラスからの 5000 サンプルでトレーニングされたモデルから再構築する能力の予備的な証拠を示します。
Reconstructing samples from the training set of trained neural networks is a major privacy concern. Haim et al. (2022) recently showed that it is possible to reconstruct training samples from neural network binary classifiers, based on theoretical results about the implicit bias of gradient methods. In this work, we present several improvements and new insights over this previous work. As our main improvement, we show that training-data reconstruction is possible in the multi-class setting and that the reconstruction quality is even higher than in the case of binary classification. Moreover, we show that using weight-decay during training increases the vulnerability to sample reconstruction. Finally, while in the previous work the training set was of size at most 1000 from 10 classes, we show preliminary evidence of the ability to reconstruct from a model trained on 5000 samples from 100 classes.