arXiv reaDer
報酬データなしで高速サンプル再重み付けを学習する
Learning Fast Sample Re-weighting Without Reward Data
サンプルの再重み付けのトレーニングは、ラベルの不均衡や破損などのデータバイアスに対処するための効果的なアプローチです。最近の方法では、強化学習とメタ学習のフレームワークに基づくモデルトレーニングと共同で、サンプルの再重み付け戦略を学習するための学習ベースのアルゴリズムが開発されています。ただし、追加の偏りのない報酬データに応じて、それらの一般的な適用性が制限されます。さらに、既存の学習ベースのサンプル再重み付け方法では、モデルと重み付けパラメータのネストされた最適化が必要であり、これにはコストのかかる2次計算が必要です。このホワイトペーパーでは、これら2つの問題に対処し、追加の報酬データを必要としない、新しい学習ベースの高速サンプル再重み付け(FSR)方法を紹介します。この方法は、2つの重要なアイデアに基づいています。履歴から学習してプロキシ報酬データを構築することと、機能を共有して最適化コストを削減することです。私たちの実験は、提案された方法が、ラベルノイズのロバスト性とロングテール認識に関して最先端技術と比較して競争力のある結果を達成し、大幅に改善されたトレーニング効率を達成しながらそうすることを示しています。ソースコードはhttps://github.com/google-research/google-research/tree/master/iegで公開されています。
Training sample re-weighting is an effective approach for tackling data biases such as imbalanced and corrupted labels. Recent methods develop learning-based algorithms to learn sample re-weighting strategies jointly with model training based on the frameworks of reinforcement learning and meta learning. However, depending on additional unbiased reward data is limiting their general applicability. Furthermore, existing learning-based sample re-weighting methods require nested optimizations of models and weighting parameters, which requires expensive second-order computation. This paper addresses these two problems and presents a novel learning-based fast sample re-weighting (FSR) method that does not require additional reward data. The method is based on two key ideas: learning from history to build proxy reward data and feature sharing to reduce the optimization cost. Our experiments show the proposed method achieves competitive results compared to state of the arts on label noise robustness and long-tailed recognition, and does so while achieving significantly improved training efficiency. The source code is publicly available at https://github.com/google-research/google-research/tree/master/ieg.
updated: Tue Sep 07 2021 17:30:56 GMT+0000 (UTC)
published: Tue Sep 07 2021 17:30:56 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト