arXiv reaDer
「データ ダイエットのディープ ラーニング」は再現するか?全体的にはい、しかし初期化時のGraNdはそうではありません
Does `Deep Learning on a Data Diet' reproduce? Overall yes, but GraNd at Initialization does not
ポールらによる論文「データダイエットのディープラーニング」。 (2021) は、ニューラル ネットワークのトレーニング中にデータセットをプルーニングするための 2 つの革新的な指標を紹介しています。エポック 20 での EL2N スコアの結果を再現できますが、初期化時の GraNd スコアについては同じことが言えません。ただし、トレーニングの後の GraNd スコアは、有用な枝刈りシグナルを提供します。初期化時の GraNd スコアは、トレーニングが行われる前に、ランダムに初期化された複数のモデルにわたる入力サンプルの平均勾配ノルムを計算します。私たちの分析は、初期化時のGraNdスコアとサンプルの入力ノルムとの間に強い相関関係があることを明らかにしており、後者がデータプルーニングの安価な新しいベースラインであった可能性があることを示唆しています.残念ながら、初期化時の GraNd スコアも入力ノルムも、ランダムな剪定のパフォーマンスを上回っていません。これは、ポールらの調査結果の 1 つと矛盾します。 (2021)。元の JAX リポジトリの更新バージョンと新しく実装された PyTorch コードベースの両方を使用して、CIFAR-10 の結果を再現することはできませんでした。 2021 年の基礎となる JAX/FLAX コードの調査により、2021 年 4 月に修正されたチェックポイント復元コードのバグが明らかになりました (https://github.com/google/flax/commit/28fbd95500f4bf2f9924d2560062fa50e919b1a5)。
The paper 'Deep Learning on a Data Diet' by Paul et al. (2021) introduces two innovative metrics for pruning datasets during the training of neural networks. While we are able to replicate the results for the EL2N score at epoch 20, the same cannot be said for the GraNd score at initialization. The GraNd scores later in training provide useful pruning signals, however. The GraNd score at initialization calculates the average gradient norm of an input sample across multiple randomly initialized models before any training has taken place. Our analysis reveals a strong correlation between the GraNd score at initialization and the input norm of a sample, suggesting that the latter could have been a cheap new baseline for data pruning. Unfortunately, neither the GraNd score at initialization nor the input norm surpasses random pruning in performance. This contradicts one of the findings in Paul et al. (2021). We were unable to reproduce their CIFAR-10 results using both an updated version of the original JAX repository and in a newly implemented PyTorch codebase. An investigation of the underlying JAX/FLAX code from 2021 surfaced a bug in the checkpoint restoring code that was fixed in April 2021 (https://github.com/google/flax/commit/28fbd95500f4bf2f9924d2560062fa50e919b1a5).
updated: Sun Mar 26 2023 15:13:19 GMT+0000 (UTC)
published: Sun Mar 26 2023 15:13:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト