arXiv reaDer
ニーモニックコードを使用したワンショットマシンのアンラーニング
One-Shot Machine Unlearning with Mnemonic Code
ディープラーニングは大幅な精度の向上を実現し、さまざまな分野に応用されています。ディープラーニングの普及に伴い、新たな問題も浮上しています。ディープラーニングモデルには、倫理的な観点から望ましくない情報が含まれる場合があります。深層学習が雇用や懲役刑などのデリケートな決定を下す場合には、この問題を解決する必要があります。機械アンラーニング(MU)は、こうした要求に応える研究領域です。 MU は、トレーニングされた深層学習モデルからの望ましくないトレーニング データを忘れることを目的としています。素朴な MU アプローチは、望ましくないデータが削除されたトレーニング データを使用してモデル全体を再トレーニングすることです。ただし、モデル全体を再トレーニングするには膨大な時間がかかり、コンピューター リソースが大量に消費される可能性があります。 MU をさらに実用的にするには、シンプルでありながら効果的な MU 方法が必要です。この論文では、追加のトレーニングを必要としないワンショット MU 手法を提案します。ワンショット MU を設計するには、望ましくない情報に敏感なモデル パラメーターにノイズを追加します。私たちが提案する方法では、フィッシャー情報行列 (FIM) を使用して敏感なモデル パラメーターを推定します。通常、トレーニング データは既存の方法で FIM を評価するために使用されます。対照的に、ニーモニック コードと呼ばれるクラス固有の合成信号を使用することで、FIM を計算するためのトレーニング データを保持する必要性を回避します。人工および自然のデータセットを使用した広範な実験により、私たちの方法が既存の方法よりも優れていることが実証されました。
Deep learning has achieved significant improvements in accuracy and has been applied to various fields. With the spread of deep learning, a new problem has also emerged; deep learning models can sometimes have undesirable information from an ethical standpoint. This problem must be resolved if deep learning is to make sensitive decisions such as hiring and prison sentencing. Machine unlearning (MU) is the research area that responds to such demands. MU aims at forgetting about undesirable training data from a trained deep learning model. A naive MU approach is to re-train the whole model with the training data from which the undesirable data has been removed. However, re-training the whole model can take a huge amount of time and consumes significant computer resources. To make MU even more practical, a simple-yet-effective MU method is required. In this paper, we propose a one-shot MU method, which does not need additional training. To design one-shot MU, we add noise to the model parameters that are sensitive to undesirable information. In our proposed method, we use the Fisher information matrix (FIM) to estimate the sensitive model parameters. Training data were usually used to evaluate the FIM in existing methods. In contrast, we avoid the need to retain the training data for calculating the FIM by using class-specific synthetic signals called mnemonic code. Extensive experiments using artificial and natural datasets demonstrate that our method outperforms the existing methods.
updated: Fri Jun 09 2023 04:59:24 GMT+0000 (UTC)
published: Fri Jun 09 2023 04:59:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト